1 Gry w postaci normalnej, gry macierzowe, stany równowagi czystej
Transkrypt
1 Gry w postaci normalnej, gry macierzowe, stany równowagi czystej
1 Gry w postaci normalnej, gry macierzowe, stany równowagi czystej i mieszanej (MNE), istnienie stanów równowagi, twierdzenie Nasha Gra n-osobowa w postaci normalnej to para (A, u), taka że: • A = A1 × · · · × An , gdzie Ai to niepusty zbiór zagrań gracza i, • u = (u1 , . . . , un ), gdzie ui : A → R to funkcja wypłat gracza i. Zamiast funkcji wypłat możemy też używać funkcji kosztu ci : A → R gracza i, gdzie ci = −ui . Elementy a = (a1 , . . . , an ) zbioru A nazywamy profilami zagrań. Stan równowagi czystej (PNE) to taki profil zagrań a, że dla każdego i i każdego a0i ∈ Ai zachodzi ui (a0i , a−i ) ≤ ui (a) Strategia dominująca gracza i to takie a∗i ∈ Ai , że dla każdego a ∈ A zachodzi ui (a∗i , a−i ) ≥ ui (a). Gra n-macierzowa to gra n-osobowa w postaci normalnej (A, u), taka że zbiory Ai są skończone. Strategia mieszana gracza i to rozkład prawdopodobieństwa na Ai . Strategie mieszane wszystkich graczy tworzą profil mieszany s = (s1 , . . . , sn ). Funkcje wypłat ui rozszerzamy na zbiór profili mieszanych przez uśrednienie ui (s) = P a inA s(a)ui (a), gdzie s(a) = s1 (a1 ) · · · sn (an ). Strategia czysta gracza i to taka strategia mieszana, która przypisuje pewnemu ai ∈ Ai prawdopodobieństwo 1. Stan równowagi mieszanej (MNE) to taki profil mieszany s, że dla każdego i i każdej strategi mieszanej s0i gracza i zachodzi uu (s0i , s−i ) ≤ ui (s) Twierdzenie Nasha mówi, że każda gra n-macierzowa ma stan równowagi mieszanej. 2 Gry o sumie zerowej a dualność w programowaniu liniowym, twierdzenie minimaksowe von Neumanna Profil (x, y) jest stanem równowagi mieszanej w grze dwumacierzowej (A, B), takim że xT Ay = u, xT By = v, wtedy i tylko wtedy gdy: P P 1. x1 , . . . , xn ≥ 0, i xi = 1, ∀j i xi bij ≤ v P 2. ∀j yj > 0 ⇒ i xi bij = v P P 3. y1 , . . . , ym ≥ 0, j yj = 1, ∀i j yj aij ≤ u P 4. ∀i xi > 0 ⇒ j yj aij = u Gra dwumacierzowa (A, B) o sumie zerowej spełnia A + B = 0, wtedy program maksymalizujący −v przy założeniach 1. i program minimalizujący u przy założeniach 3. to programy wzajemnie dualne, a warunki 2. i 4. to ich komplementarne warunki swobody. Twierdzenie minimaksowe von Neumanna dowodzi równości maxx miny xT Ay = miny maxx xT Ay. Wynika z tego, że lewa strona jest równa maksymalizacji −v przy założeniach 1., prawa minimalizacji u przy założeniach 3. i równości wartości optymalnych programów dualnych (silne twierdzenia o dualności). 1 3 Redukcja problemu znajdowania MNE do problemu znajdowania punktu stałego (wersja dokładna i przybliżona), lemat Spernera, twierdzenie Brouwera Redukcja problemu znajdowania MNE do problemu znajdowania punktu stałego przebiega przez wskazanie funkcji ze zbioru profili mieszanych w niego samego: si,a + max{0, ui (ai , s−i ) − ui (s)} (f (s))i,ai = P i 0 0 a0 si,ai + max{0, ui (ai , s−i ) − ui (s)} i Wersja dokładna wynika z tego, że punkty stałe tej funkcji to stany równowagi mieszanej. Wersja przybliżona wynika z tego, że każdy punkt δ-prawie stały tej funkcji jest stanem ε-prawie równowagi mieszanej dla δ odpowiednio zależnej od ε. Twierdzenie Brouwera o punkcie stałym mówi, że każda funkcja ciągła K → K, dla K ⊆ R zwartego i wypukłego, ma punkt stały (∃x∈K f (x) = x). Łącząc to z powyższą redukcją dostajemy dowód twierdzenia Nasha. P Lemat Spernera mówi, że jeżeli podzielimy sympleks d − 1 wymiarowy (∆d = x1 , . . . , xd ≥ 0, xi = 1) na podsympleksy o kolorowych wierzchołkach color(x) ∈ supp(x), to istnieje pełnokolowory podsympleks (o wierzchołkach z różnymi, wszystkimi d kolorami). 4 Algorytm Lemkego-Howsona, algorytm wyszukiwania wielokolorowego podsympleksu, klasa złożoności PPAD, problemy PPAD-zupełne Algorytm Lemkego-Howsona służy do znajdowania MNE w grach dwumacierzowych. Dokonując podstawienia x := xv i y := uy w warunkach na stan równowagi mieszanej (x, v, y, u) dostajemy następujące wielościany i warunki równowagi: P = {x ≥ 0, xT B ≤ 1T }, Q = {y ≥ 0, Ay T ≤ 1} ∀j yj > 0 ⇒ xT B∗j = 1 ∀i xi > 0 ⇒ Ai∗ y = 1, Rozwiązując ten układ dostajemy stan równowagi mieszanej ( 1Tx x , 1T1 x , 1Ty y , 1T1 y ) o ile x 6= 0 i y 6= 0. Zakładając niezdegenerowanie P (Q) dostajemy, że każdy wierzchołek P (Q) spełnia n (m) nierówności z równością. Niech E = {1, . . . , n, 10 , . . . , m0 } to będzie zbiór etykiet dla każdej nierówności z P i Q oraz zbiór etykiet wierzchołka to nierówności spełnione z równością, czyli: x ∈ P : E(x) = {i : xi = 0} ∪ {j 0 : xT B∗j = 1}, y ∈ Q : E(y) = {j 0 : yj = 0} ∪ {i : Ai∗ y = 1}. Para (x, y) posiadająca w sumie wszystkie etykiety jest rozwiązaniem powyższego układu. Dla każdego wierzchołka i wybranej jego etykiety, możemy przejść krawędzią wielościanu do sąsiedniego wierzchołka posiadającego wsystkie pozostałe etykiety i jakąś nową. Algorytm spaceruje po parach wierzchołków zmieniając wierzchołki naprzemiennie pozbywając się powtarzającej się etykiety zaczynając od pary sąsiad 0 w P bez etykiety n i 0 w Q. Możemy zauważyć, że przechodzimy przez pary (x, y) takie, że E(x) ∪ E(y) = E \ {n} oraz |E(x) ∩ E(y)| = 1. By poradzić sobie ze zdegenerowanymi wielościanami, rozważamy nierówności poluzowane o inne potęgi pewnego, dowolnie małego epsilona (porównujemy rozwiązania symbolicznie, leksykograficznie). Algorytm wyszukiwania wielokolorowego podsympleksu, będący dowodem lematu Spernera, spaceruje po grafie, którego wierzchołkami są wszystkie podsympleksy (także podsympleksy o mniejszych wymiarach na prefiksie zmiennych x1 + · · · + xi = 1) a krawędzie łączą podsympleksy o wymiarach równych i lub i − 1 o kolorach 1, . . . , i. Ten graf to zbiór ścieżek i cykli, gdzie końce ścieżek to pełnokolorowe sympleksy najwyżeszgo wymiaru (d − 1) lub jedyny podsympleks o wymiarze 0. Dodatkowo wynika z tego, że pełnokolorowych sympleksów jest nieparzyście wiele. [TODO] Szukanie punktu ε-prawie stałego funkcji za pomocą wyszukiwania wielokolorowego podsympleksu [TODO] Klasa PPAD [TODO] Problemy PPAD-zupełne 2 5 Stany równowagi ciągłej i atomowej w sieciach przepływowych, funkcje potencjału, istnienie stanów równowagi Sieć • • • przepływowa składa się z: (mulit)grafu skierowanego G = (V, E) dla każdego i = 1, . . . , n źródło si , ujście ti , zbiór pewnych ścieżek z si do ti oraz zapotrzebowanie ri ∈ R+ , dla każdej krawędzi e ∈ E: funkcja kosztu, ce : R+ → R+ , która jest ciągła. Przepływ w takiej sieci to funkcja f : P 3 p → fp ∈ R+ , taka że P p∈Pi = ri dla wszystkich i = 1, . . . , n. Przepływ atomowy to taki przepływ f , w którym dla każdego i = 1, . . . , n istnieje dokładnie jedna ścieżka p ∈ Pi , taka że fp = ri . Obciążenie krawędzi e ∈ E to fe = Koszt ścieżki p ∈ P to cp (f ) = P p3e fp . P e∈p ce (fe ). Całkowity koszt przepływu f to c(f ) = P p∈P cp (f )fp = P e∈E ce (fe )fe . Stan równowagi atomowej to taki przepływ f , w którym dla każdego i = 1, . . . , n i każdej pary ścieżek p, p0 ∈ Pi , takiej że fp > 0 zachodzi cp (f ) ≤ c0p (f 0 ), gdzie przepływ atomowy f 0 jest otrzymany poprzez zamianę fp0 = 0 i fp0 0 = ri . Stan równowagi ciągłej to taki przepływ f , w którym dla każdego i = 1, . . . , n i każdej pary ścieżek p, p0 ∈ Pi , takiej że fp > 0 zachodzi cp (f ) ≤ c0p (f ). Gra przepływowa atomowa to gra w której i-ty gracz wybiera ścieżkę p ∈ Pi , a jego funkcja kosztu to cpi (f )ri , gdzie f (pi ) = ri . Funkcja potencjału gry przepływowej atomowej P Pn P • dla liniowych ce : Φ(f ) = e∈E ce (fe )fe + i=1 e∈pi ce (ri )ri , P Pfe • dla jednostkowych ri = 1: Φ(f ) = e∈E i=1 ce (i). Gra przepływowa ciągła to gra w której rozważamy dowolnie wiele graczy, każdy z nich kontroluje dowolnie mały ułamek zapotrzebowania, a funkcja kosztu wynosi cp (f ). Funkcja potencjału gry przepływowej ciągłej • dla stałych ce : c(f ) Rf P • w ogólności: Φ(f ) = e∈E 0 e ce (x) dx. Nierówność wariacyjna określa warunek konieczny i wystarczający, by f był stanem równowagi ciągłej: X X ∀f ∗ ce (fe )fe ≤ ce (fe )fe∗ . e 6 e Cena anarchii stanów równowagi ciągłej w sieciach przepływowych, sieci typu Pigou, poprawianie właściwości sieci przez zwiększanie zasobów Cena anarchii w sieci przepływowej to supremum ilorazu przepływach f ∗ . c(f ) c(f ∗) po wszystkich stanach równowagi f i (optymalnych) Sieć typu Pigou to sieć przepływowa o źródle połączonym z ujściem dwoma bezpośrednimi krawędziami, jedną o stałej funkcji kosztu x → c(r), drugą o funkcji kosztu x → c(x) i zapotrzebowaniu r, dla pewnej ciągłej i niemalejącej funkcji c(r)r c : R+ → R+. Cena anarchi takiej sieci wynosi c(x)x+c(r)(r−x) . Dla dowolnego zbioru takich funkcji C, cena anarchii sieci przepływowej o kosztach krawędzi ze zbioru C jest ograniczona przez cenę anarchii α sieci typu Pigou dla pewnej c ∈ C. Rozważając sieć Pigou funkcji ce i zapotrzebowania fe otrzymujemy ce (fe )fe ≥ α(ce (fe∗ ) + ce (fe )(fe − fe∗ )). 3 P P P W ) = e ce (fe )fe ≤ α e ce (fe∗ )fe∗ + α e ce (fe )(fe − fe∗ ) ≤ αc(f ∗) + 0 Z nierówności wariacyjnej P takim razie c(f ∗ e ce (fe )(fe − fe ) ≤ 0. 7 Cena anarchii stanów równowagi atomowej w sieciach przepływowych, (λ, µ)-gładkość, cena stabilności P Gra (λ, µ)-gładka to gra dla której i ci (s∗i , s−i ) ≤ λcost(s∗ )+µcost(s), gdzie cost(s) to dowolna funkcja spełniająca P λ . cost(s) ≤ i ci (s)). Jeżeli µ < 1, to cena anarchii w grze (λ, µ)-gładkiej wynosi ≤ 1−µ X cost(s) ≤ ci (s) ≤ i X ci (s∗i , s−i ) ≤ λcost(s∗ ) + µcost(s). i Cena anarchii w sieci atomowej o liniowych funkcjach kosztu i jednostkowych zapotrzebowaniach wynosi ≤ 52 . Gra w takiej sieci jest ( 35 , 13 )-gładka. Niech ce (fe ) = ae fe + be . [TODO] Dowód. Cena stabilności w sieci przepływowej to infimum ilorazu przepływach f ∗ . [TODO] własności z zestawu 6. c(f ) c(f ∗) po wszystkich stanach równowagi f i (optymalnych) 8 Warianty i uogólnienia sieci przepływowych, gry obciążeniowe, klasa złożoności PLS, problemy PLS-zupełne 9 Minimalizacja uśrednionej straty, algorytm multiplikatywnych wag, stany równowagi słabo skorelowanej (CCE), zbieżność dynamiki bezstratnej do CCE lub MNE Problem przewidywania z podpowiedziami ekspertów to problem, w którym dany jest zbiór ekspertów (strategii) A o mocy n. Gracz w kolejnych turach ponumerowanych od 1 do T może wybrać, podpowiedzi których ekspertów będzie słuchać. Postąpienie zgodnie z podpowiedzią eksperta wiąże się z pewnym kosztem, który może się zmieniać z tury na turę i który nie jest znany aż do końca danej tury. Gracz chce wybierać podpowiedzi w taki sposób, aby zminimalizować poniesiony koszt. W turze o numerze t : 1. Gracz wybiera rozkład prawdopodobieństwa (strategię mieszaną) na zbiorze strategii σ t : A → [0, 1]. 2. Gracz obserwuje funkcję kosztu ct : A → [−1, 1], która mówi jakie koszty ponosi się w tej turze, w wyniku wybrania każdej ze strategii. Strata łączna jest określona wzorem PT Strata średnia jest zdefiniowana jako t=1 PT Ea∼σt ct (at ) − mina∈A ( t=1 ct (a)). strata łączna T Algorytm multiplikatywnych wag jest strategią dla problemu przewidywania z podpowiedziami pozwalający uzyskać stratę uśrednioną dążącą do zera przy T dążącym do nieskończoności. Niech η będzie stałą spełniającą 0 < η < 21 . Definiujemy początkowe wagi w1 (a) = 1 dla a ∈ A. W każdej spośród tur t = 1, . . . T, wybieramy strategię P ekspertów t t t t σt := w /Γ , gdzie Γ = a∈A w (a), po czym poznawszy funkcje kosztu ct definiujemy wagi ekspertów do kolejnej tury: wt+1 (a) := wt (a) · (1 − ηct (a)) dla a ∈ A. Niech µt = Ea∼σt ct (a) będzie oczekiwanym kosztem poniesionym podczas tury t. Wówczas średnia strata wynosi co n ln n 12 najwyżej η + ln ηT . W takim razie jeżeli T > 4 ln n, to dobierając η = ( T ) otrzymujemy, że średnia strata wynosi nie 1 więcej niż 2( lnTn ) 2 → 0 gdy T → ∞. Proces dynamiczny z n graczami o zbiorach strategii A1 , . . . , An i funkcjach kosztu c1 , . . . , cn : A → [−1, 1] polega na tym, że w kolejnych turach t = 1, . . . , T dla każdego gracza i = 1, . . . , n: 4 1. Gracz i wybiera strategię mieszaną σit na Ai t ci (ai , a−i ) 2. Gracz i obserwuje funkcję kosztu cti : Ai 3 ai → [−1, 1] zadaną wzorem cti (ai ) = Ea−i ∼σ−i Jeżeli PT po T iteracjach procesu strata uśredniona każdego gracza wynosi co najwyżej ε, to uśredniony rozkład σ̄ = 1 t=1 σt jest ε-przybliżonym stanem równowagi słabo skorelowanej (CCE) T Niech n = 2 oraz u : A → [−1, 1] jest funkcją wypłat gracza 1 i funkcją kosztu gracza 2. Wówczas jeżeli po T PT iteracjach procesu strata uśredniona obu graczy nie przekracza ε, to uśrednione strategie mieszane σbi = T1 t=1 σit tworzą 2ε-przybliżony stan równowagi mieszanej (MNE). 10 Projektowanie mechanizmów, motywacyjna zgodność w strategiach dominujących, aukcja drugiej ceny Vickrey’a Funkcja wyboru społecznego to f : V1 × · · · × Vn → A, gdzie A jest zbiorem możliwości, a Vi jest dziedziną preferencji gracza i (pewnym zbiorem funkcji A → R). V = V1 × · · · × Vn . Mechanizm bezpośredniego ujawniania bez opłat jest to funkcja f wyboru społecznego interpretowana jako „system”, który po przypisaniu funkcji preferenji vi ∈ Vi każdemu graczowi i staje się grą n-osobową, w której Vi jest zbiorem zagrań graca i, a funkcja użyteczności gracza i (poprzednio nazywana funkcją wypłat) wynosi ui (b) = vi (f (b)) dla każdego profilu zagrań b ∈ V . Mechanizm bezpośredniego ujawniania z opłatami to (f, p1 , . . . , pn ), gdzie pi : V → R i ui (b) = vi (f (b)) − pi (b). Zysk operatora jest równy = P i pi (b). Motywacyjna zgodność to cecha mechanizmów bezpośredniego ujawniania, które dla każdego gracza i spełniają ui (vi , b−i ) ≥ ui (b) dla każdego profilu zagrań b ∈ V (czyli zagranie preferencji vi jest strategią dominującą). Aukcja drugiej ceny Vickrey’a polega na tym, że gracze zgłaszają jednocześnie za ile kupiliby przedmiot na aukcji. Przedmiot trafia do gracza, który zgłosił najwyższą cenę i płaci on drugą najwyższą cenę. 11 Mechanizmy głosowania, twierdzenie Gibbarda-Satterthwaite’a 12 Mechanizmy z opłatami, funkcja dobrobytu społecznego, mechanizm VCG, reguła Clarke’a Społeczny dobrobyt jest równy = P i vi (f (v)). Mechanizm VCG (Vickrey’a-Clarke’a-Grovesa) to każdy mechanizm bezpośredniego ujawniania z opłatami, który spełnia: P P • f maksymalizuje społeczny dobrobyt i vi (f (v)) = maxa∈A i vi (a) dla każdego v ∈ V , P • dla każdego gracza i istnieje funkcja hi : V−i → R, taka że pi (b) = hi (b−i ) − j6=i bj (f (b)) dla każdego profilu b ∈ V (funkcja hi nie zależy od bi ). Reguła Clarke’a definiuje funkcje h1 , . . . , hn następująco: hi (bi ) = maxa∈A 5 P j6=i bj (a). 13 Środowisko jednoparametryczne, lemat Myersona, aukcja sponsorowanego wyszukiwania, projektowanie mechanizmów a algorytmy aproksymacyjne Środowisko jednoparametryczne opisuje pewien szczególny rodzaj mechanizmu bezpośredniego ujawniania, w którym: • A ⊆ Rn+ , • f : V1 × . . . × Vn → A, • przez xi (b1 , . . . , bn ) oznaczamy i-tą współrzędną wektora f (b1 , . . . , bn ), • Vi ⊆ {A 3 a 7→ v˜i xi (a) : v˜i ∈ R+ }, • każdy element zbioru Vi utożsamiamy z odpowiadającą mu liczbą v˜i i mówimy, że Vi ⊆ R+ . Problem projektowania mechanizmu polega na dobraniu takich funkcji opłat p1 , . . . , pn dla ustalonej funkcji wyboru społecznego f , aby otrzymać mechanizm motywacyjnie zgodny. Mówimy wtedy, że mechanizm implementuje funkcję f . Monotoniczna funkcja wyboru społecznego to taka funkcja f : V → R+ , że dla wszystkich i oraz dla każdego b−i ∈ V−i funkcja Vi 3 z 7→ xi (z, b−i ) ∈ R+ jest niemalejąca. Lemat Myersona mówi, że w środowisku z jednym parametrem, gdzie każde Vi jest postaci [0, Mi ] lub [0, ∞) każda monotoniczna funkcja wyboru społecznego jest implementowalna. Jeśli dodatkowo założymy, że pi (0, b−i ) = 0, to wybór funkcji opłat jest jednoznaczny. Funkcja opłat i-tego gracza dla zagrań b jest wtedy równa polu nad wykresem xi (·, b−i ): Z bi xi (b) − xi (y, b−i ) dy. pi (b) = 0 Gdy dla ustalonych i, a−i funkcja x = xi (·, a−i ) jest kawałkami stała oraz na przedziale [0, z] funkcja x ma skok w punktach z1 , . . . , zm , to m X pi (z, b−i ) = zj · (skok x w zj ). j=1 Jeśli zaś x jest różniczkowalna, to Z pi (z, b−i ) = z yx0 (y) dy. 0 Aukcja sponsorowanego wyszukiwania to mechanizm w środowisku jednoparametrycznym, który jest opisany przez parametry α1 , . . . , αk , gdzie αi > αi+1 , w którym A jest zbiorem permutacji ciągu (a1 , . . . , ak , 0, . . . , 0) ∈ Rn+ . Funkcja f jest funkcją zachłannego przydziału: ( αj , jeśli gracz i zgłosił j-tą największą wartość oraz 1 6 j 6 k xi (b) = , 0, wpp. tj. gracz, który zalicytował największą wartość otrzymuje α1 , gracz, który zalicytował drugą największą wartość otrzymuje α2 itd. Na mocy lematu Myersona f jest implementowalna za pomocą funkcji opłat: ( 0, jeśli xi (b) = 0 pi (b) = Pm . b (α − α ), jeśli xi (b) > 0 oraz bi1 >, . . . > bim są zagrywkami graczy, którzy zagrali więcej niż bi . j j+1 j=1 ij Aukcja plecakowa to mechanizm w środowisku Pn jednoparametrycznym, opisany przez parametry w1 , . . . , wn , W ∈ R+ , w którym A = {(x1 , . . . , xn ) ∈ {0, 1}n : i=1 wi xi ≤ W }. Liczenie funkcji dobrobytu społecznego jest NP-trudne, więc w praktyce będziemy chcieli znaleźć taką funkcję f , która jest aproksymacją funkcji dobrobytu. Aby dało się zaimplementować tą funkcję z motywacyjną zgodnością konieczne jest aby f jako funkcja wyboru społecznego była monotoniczna. Jeżeli dla i = 1, . . . , n zachodzi wi 6 W 2 , to algorytm zachłanny wybierający graczy w kolejności malejących ilorazów bi /wi ma tę własność. 6 14 Maksymalizacja zysku operatora w środowisku jednoparametrycznym, funkcja dobrobytu wirtualnego, aukcja drugiej ceny z ceną minimalną 15 Aukcje kombinatoryczne, stany równowagi Walrasa, funkcje substytucyjne, aukcja rosnąca Kelso-Crawforda [TODO] Aukcje kombinatoryczne [TODO] Stan równowagi Walrasa Aukcja Kelso-Crawforda z parametrem ε > 0 Data: v1 , . . . , vn : 2M → R+ - funkcje wartościujące graczy Result: S1 , . . . , Sn - podział zbioru M , p1 , . . . , pm - zestaw cen Inicjalizacja: pj := 0 dla j ∈ M , Si := ∅ dla i ∈ N ; while true do Di := optymalny zbiór gracza i dla cen pj dla j ∈ Si , pj + ε dla j 6∈ Si oraz Si ⊆ Di ; if dla wszystkich i ∈ N zachodzi Si = Di then return S1 , . . . , Sn , p1 , . . . , pm ; end Wybierz dowolnego gracza i, takiego, że Si ( Di ; pj := pj + ε dla j ∈ Di , Si := Di , Sk := Sk \ Di ; end ε-prawie równowaga Walrasa to taki przydział (S1∗ , . . . , Sn∗ ) i ceny p∗1 , . . . , p∗m , że • Dla każdego i ∈ N zbiór Si ∗ jest optymalny dla vi i cen p∗j dla j ∈ Si∗ , p∗j + ε dla j 6∈ Si∗ Sn • Jeżeli j 6∈ i=1 Si∗ , to p∗j = 0. Wartościowanie substytucyjne to taka funkcja v : 2M → R+ , że dla dowolnych wektorów cen p, q takich że 0 6 pj 6 qj dla j ∈ M i dowolnego zbioru S ⊆ M optymalnego dla v przy cenach p istnieje zbiór optymalny T ⊆ M optymalny dla v przy cenach q, taki, że j ∈ S : pj = qj ⊆ T. Jeżeli v1 , . . . , vn są wartościowaniami substytucyjnymi i gracze odpowiadają zgodnie z nimi, to aukcja Kelso-Crawforda kończy się w stanie ε-prawie równowagi Walrasa. 7