1 Gry w postaci normalnej, gry macierzowe, stany równowagi czystej

Transkrypt

1 Gry w postaci normalnej, gry macierzowe, stany równowagi czystej
1
Gry w postaci normalnej, gry macierzowe, stany równowagi czystej i
mieszanej (MNE), istnienie stanów równowagi, twierdzenie Nasha
Gra n-osobowa w postaci normalnej to para (A, u), taka że:
• A = A1 × · · · × An , gdzie Ai to niepusty zbiór zagrań gracza i,
• u = (u1 , . . . , un ), gdzie ui : A → R to funkcja wypłat gracza i.
Zamiast funkcji wypłat możemy też używać funkcji kosztu ci : A → R gracza i, gdzie ci = −ui . Elementy a =
(a1 , . . . , an ) zbioru A nazywamy profilami zagrań.
Stan równowagi czystej (PNE) to taki profil zagrań a, że dla każdego i i każdego a0i ∈ Ai zachodzi ui (a0i , a−i ) ≤
ui (a)
Strategia dominująca gracza i to takie a∗i ∈ Ai , że dla każdego a ∈ A zachodzi ui (a∗i , a−i ) ≥ ui (a).
Gra n-macierzowa to gra n-osobowa w postaci normalnej (A, u), taka że zbiory Ai są skończone.
Strategia mieszana gracza i to rozkład prawdopodobieństwa na Ai . Strategie mieszane wszystkich graczy tworzą
profil mieszany s = (s1 , . . . , sn ). Funkcje wypłat ui rozszerzamy na zbiór profili mieszanych przez uśrednienie ui (s) =
P
a inA s(a)ui (a), gdzie s(a) = s1 (a1 ) · · · sn (an ).
Strategia czysta gracza i to taka strategia mieszana, która przypisuje pewnemu ai ∈ Ai prawdopodobieństwo 1.
Stan równowagi mieszanej (MNE) to taki profil mieszany s, że dla każdego i i każdej strategi mieszanej s0i gracza
i zachodzi uu (s0i , s−i ) ≤ ui (s)
Twierdzenie Nasha mówi, że każda gra n-macierzowa ma stan równowagi mieszanej.
2
Gry o sumie zerowej a dualność w programowaniu liniowym, twierdzenie minimaksowe von Neumanna
Profil (x, y) jest stanem równowagi mieszanej w grze dwumacierzowej (A, B), takim że xT Ay = u, xT By = v,
wtedy i tylko wtedy gdy:
P
P
1. x1 , . . . , xn ≥ 0, i xi = 1, ∀j
i xi bij ≤ v
P
2. ∀j yj > 0 ⇒ i xi bij = v
P
P
3. y1 , . . . , ym ≥ 0, j yj = 1, ∀i j yj aij ≤ u
P
4. ∀i xi > 0 ⇒ j yj aij = u
Gra dwumacierzowa (A, B) o sumie zerowej spełnia A + B = 0, wtedy program maksymalizujący −v przy
założeniach 1. i program minimalizujący u przy założeniach 3. to programy wzajemnie dualne, a warunki 2. i 4. to ich
komplementarne warunki swobody.
Twierdzenie minimaksowe von Neumanna dowodzi równości maxx miny xT Ay = miny maxx xT Ay. Wynika z
tego, że lewa strona jest równa maksymalizacji −v przy założeniach 1., prawa minimalizacji u przy założeniach 3. i
równości wartości optymalnych programów dualnych (silne twierdzenia o dualności).
1
3
Redukcja problemu znajdowania MNE do problemu znajdowania punktu stałego (wersja dokładna i przybliżona), lemat Spernera, twierdzenie
Brouwera
Redukcja problemu znajdowania MNE do problemu znajdowania punktu stałego przebiega przez wskazanie
funkcji ze zbioru profili mieszanych w niego samego:
si,a + max{0, ui (ai , s−i ) − ui (s)}
(f (s))i,ai = P i
0
0
a0 si,ai + max{0, ui (ai , s−i ) − ui (s)}
i
Wersja dokładna wynika z tego, że punkty stałe tej funkcji to stany równowagi mieszanej. Wersja przybliżona wynika
z tego, że każdy punkt δ-prawie stały tej funkcji jest stanem ε-prawie równowagi mieszanej dla δ odpowiednio zależnej
od ε.
Twierdzenie Brouwera o punkcie stałym mówi, że każda funkcja ciągła K → K, dla K ⊆ R zwartego i wypukłego,
ma punkt stały (∃x∈K f (x) = x). Łącząc to z powyższą redukcją dostajemy dowód twierdzenia Nasha.
P
Lemat Spernera mówi, że jeżeli podzielimy sympleks d − 1 wymiarowy (∆d = x1 , . . . , xd ≥ 0, xi = 1) na podsympleksy o kolorowych wierzchołkach color(x) ∈ supp(x), to istnieje pełnokolowory podsympleks (o wierzchołkach z
różnymi, wszystkimi d kolorami).
4
Algorytm Lemkego-Howsona, algorytm wyszukiwania wielokolorowego
podsympleksu, klasa złożoności PPAD, problemy PPAD-zupełne
Algorytm Lemkego-Howsona służy do znajdowania MNE w grach dwumacierzowych. Dokonując podstawienia
x := xv i y := uy w warunkach na stan równowagi mieszanej (x, v, y, u) dostajemy następujące wielościany i warunki
równowagi:
P = {x ≥ 0, xT B ≤ 1T }, Q = {y ≥ 0, Ay T ≤ 1}
∀j yj > 0 ⇒ xT B∗j = 1
∀i xi > 0 ⇒ Ai∗ y = 1,
Rozwiązując ten układ dostajemy stan równowagi mieszanej ( 1Tx x , 1T1 x , 1Ty y , 1T1 y ) o ile x 6= 0 i y 6= 0. Zakładając
niezdegenerowanie P (Q) dostajemy, że każdy wierzchołek P (Q) spełnia n (m) nierówności z równością. Niech E =
{1, . . . , n, 10 , . . . , m0 } to będzie zbiór etykiet dla każdej nierówności z P i Q oraz zbiór etykiet wierzchołka to nierówności
spełnione z równością, czyli:
x ∈ P : E(x) = {i : xi = 0} ∪ {j 0 : xT B∗j = 1},
y ∈ Q : E(y) = {j 0 : yj = 0} ∪ {i : Ai∗ y = 1}.
Para (x, y) posiadająca w sumie wszystkie etykiety jest rozwiązaniem powyższego układu. Dla każdego wierzchołka
i wybranej jego etykiety, możemy przejść krawędzią wielościanu do sąsiedniego wierzchołka posiadającego wsystkie
pozostałe etykiety i jakąś nową. Algorytm spaceruje po parach wierzchołków zmieniając wierzchołki naprzemiennie
pozbywając się powtarzającej się etykiety zaczynając od pary sąsiad 0 w P bez etykiety n i 0 w Q. Możemy zauważyć,
że przechodzimy przez pary (x, y) takie, że E(x) ∪ E(y) = E \ {n} oraz |E(x) ∩ E(y)| = 1. By poradzić sobie ze
zdegenerowanymi wielościanami, rozważamy nierówności poluzowane o inne potęgi pewnego, dowolnie małego epsilona
(porównujemy rozwiązania symbolicznie, leksykograficznie).
Algorytm wyszukiwania wielokolorowego podsympleksu, będący dowodem lematu Spernera, spaceruje po
grafie, którego wierzchołkami są wszystkie podsympleksy (także podsympleksy o mniejszych wymiarach na prefiksie
zmiennych x1 + · · · + xi = 1) a krawędzie łączą podsympleksy o wymiarach równych i lub i − 1 o kolorach 1, . . . , i. Ten
graf to zbiór ścieżek i cykli, gdzie końce ścieżek to pełnokolorowe sympleksy najwyżeszgo wymiaru (d − 1) lub jedyny
podsympleks o wymiarze 0. Dodatkowo wynika z tego, że pełnokolorowych sympleksów jest nieparzyście wiele.
[TODO] Szukanie punktu ε-prawie stałego funkcji za pomocą wyszukiwania wielokolorowego podsympleksu
[TODO] Klasa PPAD
[TODO] Problemy PPAD-zupełne
2
5
Stany równowagi ciągłej i atomowej w sieciach przepływowych, funkcje
potencjału, istnienie stanów równowagi
Sieć
•
•
•
przepływowa składa się z:
(mulit)grafu skierowanego G = (V, E)
dla każdego i = 1, . . . , n źródło si , ujście ti , zbiór pewnych ścieżek z si do ti oraz zapotrzebowanie ri ∈ R+ ,
dla każdej krawędzi e ∈ E: funkcja kosztu, ce : R+ → R+ , która jest ciągła.
Przepływ w takiej sieci to funkcja f : P 3 p → fp ∈ R+ , taka że
P
p∈Pi
= ri dla wszystkich i = 1, . . . , n.
Przepływ atomowy to taki przepływ f , w którym dla każdego i = 1, . . . , n istnieje dokładnie jedna ścieżka p ∈ Pi ,
taka że fp = ri .
Obciążenie krawędzi e ∈ E to fe =
Koszt ścieżki p ∈ P to cp (f ) =
P
p3e
fp .
P
e∈p ce (fe ).
Całkowity koszt przepływu f to c(f ) =
P
p∈P
cp (f )fp =
P
e∈E ce (fe )fe .
Stan równowagi atomowej to taki przepływ f , w którym dla każdego i = 1, . . . , n i każdej pary ścieżek p, p0 ∈ Pi ,
takiej że fp > 0 zachodzi cp (f ) ≤ c0p (f 0 ), gdzie przepływ atomowy f 0 jest otrzymany poprzez zamianę fp0 = 0 i fp0 0 = ri .
Stan równowagi ciągłej to taki przepływ f , w którym dla każdego i = 1, . . . , n i każdej pary ścieżek p, p0 ∈ Pi ,
takiej że fp > 0 zachodzi cp (f ) ≤ c0p (f ).
Gra przepływowa atomowa to gra w której i-ty gracz wybiera ścieżkę p ∈ Pi , a jego funkcja kosztu to cpi (f )ri ,
gdzie f (pi ) = ri .
Funkcja potencjału gry przepływowej atomowej
P
Pn P
• dla liniowych ce : Φ(f ) = e∈E ce (fe )fe + i=1 e∈pi ce (ri )ri ,
P
Pfe
• dla jednostkowych ri = 1: Φ(f ) = e∈E i=1
ce (i).
Gra przepływowa ciągła to gra w której rozważamy dowolnie wiele graczy, każdy z nich kontroluje dowolnie mały
ułamek zapotrzebowania, a funkcja kosztu wynosi cp (f ).
Funkcja potencjału gry przepływowej ciągłej
• dla stałych ce : c(f )
Rf
P
• w ogólności: Φ(f ) = e∈E 0 e ce (x) dx.
Nierówność wariacyjna określa warunek konieczny i wystarczający, by f był stanem równowagi ciągłej:
X
X
∀f ∗
ce (fe )fe ≤
ce (fe )fe∗ .
e
6
e
Cena anarchii stanów równowagi ciągłej w sieciach przepływowych, sieci
typu Pigou, poprawianie właściwości sieci przez zwiększanie zasobów
Cena anarchii w sieci przepływowej to supremum ilorazu
przepływach f ∗ .
c(f )
c(f ∗)
po wszystkich stanach równowagi f i (optymalnych)
Sieć typu Pigou to sieć przepływowa o źródle połączonym z ujściem dwoma bezpośrednimi krawędziami, jedną o stałej
funkcji kosztu x → c(r), drugą o funkcji kosztu x → c(x) i zapotrzebowaniu r, dla pewnej ciągłej i niemalejącej funkcji
c(r)r
c : R+ → R+. Cena anarchi takiej sieci wynosi c(x)x+c(r)(r−x)
. Dla dowolnego zbioru takich funkcji C, cena anarchii
sieci przepływowej o kosztach krawędzi ze zbioru C jest ograniczona przez cenę anarchii α sieci typu Pigou dla pewnej
c ∈ C. Rozważając sieć Pigou funkcji ce i zapotrzebowania fe otrzymujemy ce (fe )fe ≥ α(ce (fe∗ ) + ce (fe )(fe − fe∗ )).
3
P
P
P
W
) = e ce (fe )fe ≤ α e ce (fe∗ )fe∗ + α e ce (fe )(fe − fe∗ ) ≤ αc(f ∗) + 0 Z nierówności wariacyjnej
P takim razie c(f
∗
e ce (fe )(fe − fe ) ≤ 0.
7
Cena anarchii stanów równowagi atomowej w sieciach przepływowych,
(λ, µ)-gładkość, cena stabilności
P
Gra (λ, µ)-gładka
to gra dla której i ci (s∗i , s−i ) ≤ λcost(s∗ )+µcost(s), gdzie cost(s) to dowolna funkcja spełniająca
P
λ
.
cost(s) ≤ i ci (s)). Jeżeli µ < 1, to cena anarchii w grze (λ, µ)-gładkiej wynosi ≤ 1−µ
X
cost(s) ≤
ci (s) ≤
i
X
ci (s∗i , s−i ) ≤ λcost(s∗ ) + µcost(s).
i
Cena anarchii w sieci atomowej o liniowych funkcjach kosztu i jednostkowych zapotrzebowaniach wynosi
≤ 52 . Gra w takiej sieci jest ( 35 , 13 )-gładka. Niech ce (fe ) = ae fe + be . [TODO] Dowód.
Cena stabilności w sieci przepływowej to infimum ilorazu
przepływach f ∗ . [TODO] własności z zestawu 6.
c(f )
c(f ∗)
po wszystkich stanach równowagi f i (optymalnych)
8
Warianty i uogólnienia sieci przepływowych, gry obciążeniowe, klasa
złożoności PLS, problemy PLS-zupełne
9
Minimalizacja uśrednionej straty, algorytm multiplikatywnych wag, stany równowagi słabo skorelowanej (CCE), zbieżność dynamiki bezstratnej do CCE lub MNE
Problem przewidywania z podpowiedziami ekspertów to problem, w którym dany jest zbiór ekspertów (strategii) A o mocy n. Gracz w kolejnych turach ponumerowanych od 1 do T może wybrać, podpowiedzi których ekspertów
będzie słuchać. Postąpienie zgodnie z podpowiedzią eksperta wiąże się z pewnym kosztem, który może się zmieniać
z tury na turę i który nie jest znany aż do końca danej tury. Gracz chce wybierać podpowiedzi w taki sposób, aby
zminimalizować poniesiony koszt.
W turze o numerze t :
1. Gracz wybiera rozkład prawdopodobieństwa (strategię mieszaną) na zbiorze strategii σ t : A → [0, 1].
2. Gracz obserwuje funkcję kosztu ct : A → [−1, 1], która mówi jakie koszty ponosi się w tej turze, w wyniku
wybrania każdej ze strategii.
Strata łączna jest określona wzorem
PT
Strata średnia jest zdefiniowana jako
t=1
PT
Ea∼σt ct (at ) − mina∈A ( t=1 ct (a)).
strata łączna
T
Algorytm multiplikatywnych wag jest strategią dla problemu przewidywania z podpowiedziami pozwalający uzyskać stratę uśrednioną dążącą do zera przy T dążącym do nieskończoności. Niech η będzie stałą spełniającą 0 < η < 21 .
Definiujemy początkowe wagi
w1 (a) = 1 dla a ∈ A. W każdej spośród tur t = 1, . . . T, wybieramy strategię
P ekspertów
t
t
t
t
σt := w /Γ , gdzie Γ = a∈A w (a), po czym poznawszy funkcje kosztu ct definiujemy wagi ekspertów do kolejnej
tury: wt+1 (a) := wt (a) · (1 − ηct (a)) dla a ∈ A.
Niech µt = Ea∼σt ct (a) będzie oczekiwanym kosztem poniesionym podczas tury t. Wówczas średnia strata wynosi co
n
ln n 12
najwyżej η + ln
ηT . W takim razie jeżeli T > 4 ln n, to dobierając η = ( T ) otrzymujemy, że średnia strata wynosi nie
1
więcej niż 2( lnTn ) 2 → 0 gdy T → ∞.
Proces dynamiczny z n graczami o zbiorach strategii A1 , . . . , An i funkcjach kosztu c1 , . . . , cn : A → [−1, 1] polega
na tym, że w kolejnych turach t = 1, . . . , T dla każdego gracza i = 1, . . . , n:
4
1. Gracz i wybiera strategię mieszaną σit na Ai
t ci (ai , a−i )
2. Gracz i obserwuje funkcję kosztu cti : Ai 3 ai → [−1, 1] zadaną wzorem cti (ai ) = Ea−i ∼σ−i
Jeżeli
PT po T iteracjach procesu strata uśredniona każdego gracza wynosi co najwyżej ε, to uśredniony rozkład σ̄ =
1
t=1 σt jest ε-przybliżonym stanem równowagi słabo skorelowanej (CCE)
T
Niech n = 2 oraz u : A → [−1, 1] jest funkcją wypłat gracza 1 i funkcją kosztu gracza 2. Wówczas jeżeli po T
PT
iteracjach procesu strata uśredniona obu graczy nie przekracza ε, to uśrednione strategie mieszane σbi = T1 t=1 σit
tworzą 2ε-przybliżony stan równowagi mieszanej (MNE).
10
Projektowanie mechanizmów, motywacyjna zgodność w strategiach
dominujących, aukcja drugiej ceny Vickrey’a
Funkcja wyboru społecznego to f : V1 × · · · × Vn → A, gdzie A jest zbiorem możliwości, a Vi jest dziedziną
preferencji gracza i (pewnym zbiorem funkcji A → R). V = V1 × · · · × Vn .
Mechanizm bezpośredniego ujawniania bez opłat jest to funkcja f wyboru społecznego interpretowana jako
„system”, który po przypisaniu funkcji preferenji vi ∈ Vi każdemu graczowi i staje się grą n-osobową, w której Vi jest
zbiorem zagrań graca i, a funkcja użyteczności gracza i (poprzednio nazywana funkcją wypłat) wynosi ui (b) = vi (f (b))
dla każdego profilu zagrań b ∈ V .
Mechanizm bezpośredniego ujawniania z opłatami to (f, p1 , . . . , pn ), gdzie pi : V → R i ui (b) = vi (f (b)) − pi (b).
Zysk operatora jest równy =
P
i
pi (b).
Motywacyjna zgodność to cecha mechanizmów bezpośredniego ujawniania, które dla każdego gracza i spełniają
ui (vi , b−i ) ≥ ui (b) dla każdego profilu zagrań b ∈ V (czyli zagranie preferencji vi jest strategią dominującą).
Aukcja drugiej ceny Vickrey’a polega na tym, że gracze zgłaszają jednocześnie za ile kupiliby przedmiot na aukcji.
Przedmiot trafia do gracza, który zgłosił najwyższą cenę i płaci on drugą najwyższą cenę.
11
Mechanizmy głosowania, twierdzenie Gibbarda-Satterthwaite’a
12
Mechanizmy z opłatami, funkcja dobrobytu społecznego, mechanizm
VCG, reguła Clarke’a
Społeczny dobrobyt jest równy =
P
i
vi (f (v)).
Mechanizm VCG (Vickrey’a-Clarke’a-Grovesa) to każdy mechanizm bezpośredniego ujawniania z opłatami,
który spełnia:
P
P
• f maksymalizuje społeczny dobrobyt i vi (f (v)) = maxa∈A i vi (a) dla każdego v ∈ V ,
P
• dla każdego gracza i istnieje funkcja hi : V−i → R, taka że pi (b) = hi (b−i ) − j6=i bj (f (b)) dla każdego profilu
b ∈ V (funkcja hi nie zależy od bi ).
Reguła Clarke’a definiuje funkcje h1 , . . . , hn następująco: hi (bi ) = maxa∈A
5
P
j6=i bj (a).
13
Środowisko jednoparametryczne, lemat Myersona, aukcja sponsorowanego wyszukiwania, projektowanie mechanizmów a algorytmy aproksymacyjne
Środowisko jednoparametryczne opisuje pewien szczególny rodzaj mechanizmu bezpośredniego ujawniania, w
którym:
• A ⊆ Rn+ ,
• f : V1 × . . . × Vn → A,
• przez xi (b1 , . . . , bn ) oznaczamy i-tą współrzędną wektora f (b1 , . . . , bn ),
• Vi ⊆ {A 3 a 7→ v˜i xi (a) : v˜i ∈ R+ },
• każdy element zbioru Vi utożsamiamy z odpowiadającą mu liczbą v˜i i mówimy, że Vi ⊆ R+ .
Problem projektowania mechanizmu polega na dobraniu takich funkcji opłat p1 , . . . , pn dla ustalonej funkcji
wyboru społecznego f , aby otrzymać mechanizm motywacyjnie zgodny. Mówimy wtedy, że mechanizm implementuje
funkcję f .
Monotoniczna funkcja wyboru społecznego to taka funkcja f : V → R+ , że dla wszystkich i oraz dla każdego
b−i ∈ V−i funkcja Vi 3 z 7→ xi (z, b−i ) ∈ R+ jest niemalejąca.
Lemat Myersona mówi, że w środowisku z jednym parametrem, gdzie każde Vi jest postaci [0, Mi ] lub [0, ∞) każda
monotoniczna funkcja wyboru społecznego jest implementowalna. Jeśli dodatkowo założymy, że pi (0, b−i ) = 0, to
wybór funkcji opłat jest jednoznaczny.
Funkcja opłat i-tego gracza dla zagrań b jest wtedy równa polu nad wykresem xi (·, b−i ):
Z
bi
xi (b) − xi (y, b−i ) dy.
pi (b) =
0
Gdy dla ustalonych i, a−i funkcja x = xi (·, a−i ) jest kawałkami stała oraz na przedziale [0, z] funkcja x ma skok w
punktach z1 , . . . , zm , to
m
X
pi (z, b−i ) =
zj · (skok x w zj ).
j=1
Jeśli zaś x jest różniczkowalna, to
Z
pi (z, b−i ) =
z
yx0 (y) dy.
0
Aukcja sponsorowanego wyszukiwania to mechanizm w środowisku jednoparametrycznym, który jest opisany
przez parametry α1 , . . . , αk , gdzie αi > αi+1 , w którym A jest zbiorem permutacji ciągu (a1 , . . . , ak , 0, . . . , 0) ∈ Rn+ .
Funkcja f jest funkcją zachłannego przydziału:
(
αj , jeśli gracz i zgłosił j-tą największą wartość oraz 1 6 j 6 k
xi (b) =
,
0,
wpp.
tj. gracz, który zalicytował największą wartość otrzymuje α1 , gracz, który zalicytował drugą największą wartość
otrzymuje α2 itd. Na mocy lematu Myersona f jest implementowalna za pomocą funkcji opłat:
(
0,
jeśli xi (b) = 0
pi (b) = Pm
.
b
(α
−
α
),
jeśli xi (b) > 0 oraz bi1 >, . . . > bim są zagrywkami graczy, którzy zagrali więcej niż bi .
j
j+1
j=1 ij
Aukcja plecakowa to mechanizm w środowisku
Pn jednoparametrycznym, opisany przez parametry w1 , . . . , wn , W ∈ R+ ,
w którym A = {(x1 , . . . , xn ) ∈ {0, 1}n : i=1 wi xi ≤ W }. Liczenie funkcji dobrobytu społecznego jest NP-trudne,
więc w praktyce będziemy chcieli znaleźć taką funkcję f , która jest aproksymacją funkcji dobrobytu. Aby dało się
zaimplementować tą funkcję z motywacyjną zgodnością konieczne jest aby f jako funkcja wyboru społecznego była
monotoniczna. Jeżeli dla i = 1, . . . , n zachodzi wi 6 W
2 , to algorytm zachłanny wybierający graczy w kolejności
malejących ilorazów bi /wi ma tę własność.
6
14
Maksymalizacja zysku operatora w środowisku jednoparametrycznym,
funkcja dobrobytu wirtualnego, aukcja drugiej ceny z ceną minimalną
15
Aukcje kombinatoryczne, stany równowagi Walrasa, funkcje substytucyjne, aukcja rosnąca Kelso-Crawforda
[TODO] Aukcje kombinatoryczne
[TODO] Stan równowagi Walrasa
Aukcja Kelso-Crawforda z parametrem ε > 0
Data: v1 , . . . , vn : 2M → R+ - funkcje wartościujące graczy
Result: S1 , . . . , Sn - podział zbioru M , p1 , . . . , pm - zestaw cen
Inicjalizacja: pj := 0 dla j ∈ M , Si := ∅ dla i ∈ N ;
while true do
Di := optymalny zbiór gracza i dla cen pj dla j ∈ Si , pj + ε dla j 6∈ Si oraz Si ⊆ Di ;
if dla wszystkich i ∈ N zachodzi Si = Di then
return S1 , . . . , Sn , p1 , . . . , pm ;
end
Wybierz dowolnego gracza i, takiego, że Si ( Di ;
pj := pj + ε dla j ∈ Di , Si := Di , Sk := Sk \ Di ;
end
ε-prawie równowaga Walrasa to taki przydział (S1∗ , . . . , Sn∗ ) i ceny p∗1 , . . . , p∗m , że
• Dla każdego i ∈ N zbiór Si ∗ jest optymalny dla vi i cen p∗j dla j ∈ Si∗ , p∗j + ε dla j 6∈ Si∗
Sn
• Jeżeli j 6∈ i=1 Si∗ , to p∗j = 0.
Wartościowanie substytucyjne to taka funkcja v : 2M → R+ , że dla dowolnych wektorów cen p, q takich że
0 6 pj 6 qj dla j ∈ M i dowolnego zbioru S ⊆ M optymalnego dla v przy cenach p istnieje zbiór optymalny T ⊆ M
optymalny dla v przy cenach q, taki, że j ∈ S : pj = qj ⊆ T.
Jeżeli v1 , . . . , vn są wartościowaniami substytucyjnymi i gracze odpowiadają zgodnie z nimi, to aukcja Kelso-Crawforda
kończy się w stanie ε-prawie równowagi Walrasa.
7

Podobne dokumenty