zbiór strategii czystych gracza i
Transkrypt
zbiór strategii czystych gracza i
niektóre OZNACZENIA • Wi : macierz wyplat gracza i • Si : zbiór strategii czystych gracza i; Mi : zbiór strategii mieszanych gracza i; M−i = ∏ Mj j̸=i • supp σi : nośnik strategii mieszanej • σi (s): prawdopodobieństwo odpowiadaja,ce strategii czystej s, w strategii mieszanej σi ∈ Mi • wk (σ̄−i ; σi ): wyplata gracza k, gdy gracz i stosuje strategie, σi , a σ̄−i ∈ M−i jest ukladem strategii przeciwników gracza i • Mndom : zbiór wszystkich strategii niezdominowanych (mieszanych) gracza i i • Mbest : zbiór wszystkich najlepszych odpowiedzi gracza i i • conv A: powloka (otoczka) wypukla zbioru A • gra dwumacierzowa: dwuosobowa gra w postaci strategicznej • gra macierzowa: dwuosobowa gra o sumie zerowej, w postaci strategicznej • Bi : poziom bezpieczeństwa gracza i; val (G): wartość gry • L(A): zbiór loterii nad zbiorem A wszystkich wyników gry • prl (σ̄) lub prl (b̄): rozklad prawdopodobieństwa generowany na zbiorze liści przez uklad strategii mieszanych lub behawioralnych • rn(W, Q): rozwia,zanie arbitrażowe Nasha dla zbioru W i punktu niezgody Q • rdz(v): rdzeń gry o funkcji charakterystycznej v • ϕ(v): wartość Shapleya dla gry o funkcji charakterystycznej v Monotoniczność preferencji: Dla dowolnych L1 , L2 , L3 ∈ L(A) i p ∈ (0, 1] zachodzi równoważność: L1 ≼ L2 ⇔ pL1 + (1 − p)L3 ≼ pL2 + (1 − p)L3 Cia,glość preferencji: Dla dowolnych L1 , L2 , L3 ∈ L(A) zachodzi implikacja: L1 ≺ L2 ≺ L3 ⇒ ∃ p∈(0,1) L2 ≈ pL1 + (1 − p)L3 Aksjomaty schematu arbitrażowego Nasha: (A1) Osia,galność (A2) Optimum Pareto (A3) O symetryczności (A4) Zgodność ze zmiana, skali użyteczności (A5) Niezależność od możliwości nieistotnych Aksjomaty Shapleya: (S1) O efektywności (S2) O symetryczności ról (S3) O graczu nieistotnym (S4) O addytywności niektóre TWIERDZENIA prawdopodobieńWlasność 1 (Podstawowa wl. wyplaty). Jeżeli τ1 , τ2 , . . . , τt ∈ Mi oraz (p1(, p2 , . . . , pt ) jest rozk ) ladem ∑t ∑t stwa, to dla dowolnego σ̄−i ∈ M−i oraz dla dowolnego gracza j zachodzi wj σ̄−i ; m=1 pm τm = m=1 pm wj (σ̄−i ; τm ). Wlasność 2. (D1) Strategia σi ∈ Mi jest zdominowana przez σi′ ∈ Mi wtedy i tylko wtedy, gdy dla dowolnego ukladu strategii czystych s̄−i zachodzi wi (s̄−i ; σi′ ) > wi (s̄−i ; σi ). (D2) Jeżeli σi ∈ Mndom , to żadna strategia czysta z nośnika σi nie jest zdominowana. i (D3) Jeżeli w grze nie ma strategii σi , σi′ ∈ Mi o rozla,cznych nośnikach, dla których σi ≺ σi′ , to gracz i nie ma żadnej strategii zdominowanej. (D4) Jeśli s ∈ Si jest zdominowana, to jest też zdominowana przez strategie, bez s w nośniku. (D5) Końcowy wynik iterowanego usuwania strategii zdominowanych nie zależy od kolejności usuwania strategii. Twierdzenie 3. (O1) Jeśli wektor osia,galny (a1 , . . . , an ) nie jest optimum Pareto, to istnieje taki rozkad prawdopodobieństwa (p1 , . . . , pt ) na zb. ukladów strategii czystych {s̄1 , . . . , s̄t }, że dla wszystkich graczy i ai 6 p1 wi (s̄1 ) + . . . + pt wi (s̄t ) oraz ostra nierówność zachodzi w przynajmniej jednym przypadku. (O2) Jeżeli (a1 , . . . , an ) nie jest optimum Pareto i jest osigalny przez ukad strategii czystych s̄, to powyższy rozklad prawdopodobieństwa istnieje również na zbiorze ukladów strategii czystych, niezawieraja,cym s̄. Wlasność 4. (a) sup wi (σ̄−j ; σj ) = max wi (σ̄−j ; sj ), σj ∈Mj sj ∈Sj inf σj ∈Mj wi (σ̄−j ; σj ) = min wi (σ̄−j ; sj ). sj ∈Sj (b) Jeżeli x ∈ R, a dla strategii s1 , s2 , . . . , sn gracza j zachodzi wi (σ̄−j ; sj ) > x dla i = 1, 2, . . . , n, to dla każdej strategii σj ∈ conv {s1 , . . . , sn } zachodzi wi (σ̄−j ; σj ) > x. Analogiczne wlasności sa, prawdziwe, gdy zasta,pimy wsze,dzie znak > znakiem =, lub <, lub >, lub 6. Twierdzenie 5 (o minimaksie; von Neumann). W grze macierzowej B1 + B2 = 0. 1 2 Twierdzenie 6 (o minimaksie’; von Neumann). W grze macierzowej istnieje dokladnie jedno takie x ∈ R, że istnieja, strategie σ1 ∈ M1 i σ2 ∈ M2 spelniaja,ce oba warunki: ∀s2 ∈S2 w1 (σ1 , s2 ) > x, ∀s1 ∈S1 w1 (s1 , σ2 ) 6 x. Twierdzenie 7 (o dualności). Jeśli wzajemnie dualne zagadnia LP i DLP z funkcjami celu odpowiednio f i g maja, rozwia,zanie, to max f = min g. Wlasność 8. W grze macierzowej: Jeżeli w grze macierzowej strategie σ1 ∈ M1 i σ2 ∈ M2 sa, optymalne, to wi (σ1 , σ2 ) = Bi . Usuwanie (wielokrotne) strategii zdominowanych nie zmienia zbiorów strategi optymalnych. Usuwanie (wielokrotne) strategii slabo zdominowanych może zmniejszyć zb. strategi optymalnych, ale coś zostanie. Zalóżmy, że supp σ1 = S1 i supp σ2 = S2 . Wówczas σ1 i σ2 s optymalne wtedy i tylko wtedy, gdy dla i = 1, 2 σi daje graczowi i zawsze te, sama, wyplate,, niezależnie od strategii przeciwnika. (PB5) Zalóżmy, że supp σ1 = S1 i supp σ2 = S2 . σ1 i σ2 sa, optymalne wtedy i tylko wtedy, gdy σi daje graczowi i zawsze te, sama, wyplate,, niezależnie od strategii przeciwnika (dla i = 1, 2). (PB1) (PB2) (PB3) (PB4) Wlasność 9. (NO1) σi ∈ Mi jest najlepsza, odpowiedzia, na σ̄−i wtedy i tylko wtedy, gdy wi (σ̄−i ; si ) 6 wi (σ̄−i ; σi ) dla każdego si ∈ Si . (NO2) Jeżeli σi ∈ Mi jest najlepsza, odpowiedzia, na σ̄−i , to każda strategia czysta z nośnika σi daje w odpowiedzi na σ̄−i te, sama, wyplate, graczowi i. (NO3) σi jest n.o. na σ̄−i wtedy i tylko wtedy, gdy każda strategia czysta z nośnika σi jest najlepsza, spośród str. czystych odpowiedzia, na σ̄−i . (NO4) σi ∈ Mi jest najlepsza, odpowiedzia, na σ̄−i wtedy i tylko wtedy, gdy każda strategia czysta z nośnika σi jest najlepsza, odpowiedzia, na σ̄−i . (NO5) W grach dwumacierzowych Mbest = Mndom . i i Wlasność 10. (RN1) (RN2) (RN3) (RN4) Usuwanie strategii spoza Mbest nie zmienia zbioru punktów równowagi gry. i Usuwanie strategii spoza Mndom nie zmienia zbioru punktów równowagi gry. i Po usuwanie,ciu strategii slabo zdominowanych, zbiór p.r. Nasha jest podzbiorem p.r. Nasha wyjściowej gry. W grze macierzowej (σ1 , σ2 ) ∈ M1 × M2 jest punktem równowagi Nasha wgdy σ1 i σ2 sa, optymalne. Twierdzenie 11 (O użyteczności). Jeżeli realcja preferencji jest ≺ jest quasi-porza,dkiem liniowym na L(A) oraz jest monotoniczna i cia,gla, to istnieje funkcja użyteczności u : A → R o naste,puja,cej wlasności: Dla dowolnych loterii p1 [a1 ] + . . . + pk [ak ] i p′1 [a1 ] + . . . + p′k [ak ] p1 [a1 ] + . . . + pk [ak ] ≼ p′1 [a1 ] + . . . + p′k [ak ] ⇔ p1 u(a1 ) + . . . + pk u(ak ) 6 p′1 u(a1 ) + . . . + p′k u(ak ). Ponadto funkcja taka jest wyznaczona jednoznacznie z dokladnościa, do dodatniego przeksztalcenia afinicznego. Wlasność 12. (RS1) W grze w postaci ekstensywnej strategie σi ∈ Mi oraz bi ∈ Bi sa, równoważne wtedy i tylko wtedy, gdy dla każdego ukladu strategii czystych s̄−i zachodzi prl (s̄−i ; σi ) = prl (s̄−i ; bi ). (RS2) O prawdopodobieństwach dojścia do wierzcholków drzewa. (RS3) Każdej strategii behawioralnej bi odpowiada (naturalnie) rozklad pr. na Si . Jeżeli rozklad ten jest taki sam jak σi , to σi i bi s równoważne. Twierdzenie 13 (Kuhn 1953). W n–osobowej grze w postaci ekstensywnej z pamie,cia, doskonala,, dla każdej strategii mieszanej istnieje równoważna jej strategia behawioralna. Twierdzenie 14 (Nash 1950). Istnieje doklanie jedno rozwia,zanie arbitrażowe w sensie Nasha rn : G → R2 , gdzie G = {(W, Q) : W jest podzbiorem zwartym i wypuklym w R2 , Q ∈ W, istnieje w W punkt (x, y) > Q}. Ponadto rn(W, (q1 , q2 )) = argmax (x,y)∈W (x − q1 )(y − q2 ). x>q1 , y>q2 Twierdzenie 15 (Shapley 1953). Na zbiorze koalicyjnych gier n-osobowych istnieje dokladnie jedna funkcja ϕ spelniaja,ca aksjomaty (S1)–(S4). Ponadto ∑ ( ) 1 ϕi (v) = v(G̃6i ) − v(G̃<i ) . n! G̃: uporz.w.k.