Gry o sumie zero Gry o sumie zero - gry rozgrywane w strategiach

Transkrypt

Gry o sumie zero Gry o sumie zero - gry rozgrywane w strategiach
11/22/2014
Gry o sumie zero gry rozgrywane w strategiach mieszanych
STRATEGIE MIESZANE - MOTYWACJA.
ROZWAśMY PRZYKŁAD:
− 1 5 
 2 − 3


DEFINICJA 2.3.6
Strategią mieszaną π gracza P nazywamy kaŜdy rozkład prawdopodobieństwa
określony na zbiorze S jego strategii czystych.
W grach macierzowych, w których zbiory strategii czystych są skończone, rozkłady
prawdopodobieństwa mogą być utoŜsamiane z wektorami o nieujemnych
współrzędnych sumujących się do jedności. RozwaŜmy zatem grę <A, B, M>, w
której gracz I ma m zaś gracz II ma n strategii czystych. Wtedy zbiory A*, B*
strategii mieszanych graczy są następujące
m
A* = {α = (α1 ,K,α m ) : ∑ α i = 1, ∀ i = 1,K, m, α i ≥ 0}
i =1
n
B* = {β = ( β1 ,K, β n ) : ∑ β i = 1, ∀ i = 1,K, n, β i ≥ 0}
j =1
1
11/22/2014
Zachodzą waŜne relacje:
A ⊆ A* oraz B ⊆ B*,
gdyŜ strategie czyste moŜemy utoŜsamiać z rozkładami skoncentrowanymi w
jednym punkcie:
ai ≡ (0, K ,0,1,0, K,0)
b j ≡ (0, K ,0,1,0,K ,0)
PoniewaŜ wypłaty graczy podane są za pomocą ich funkcji uŜyteczności, a wybory
strategii dokonywane przez graczy są od siebie niezaleŜne, zatem łatwo moŜemy
rozszerzyć definicje funkcji wypłaty M tak, by była określona na całym zbiorze
strategii mieszanych.
m
n
m
n
M (α, β) = αMβ T = ∑∑ M (ai , b j )α i β j = ∑∑ M i jα i β j
i =1 j =1
i =1 j =1
W przypadku gdy będziemy chcieli podkreślić, Ŝe gracz uŜywa strategię czystą, w
funkcji wypłaty będziemy wpisywali jedynie jej numer. Na przykład M(α , j)
oznacza, Ŝe gracz I gra pewną strategię α (mieszaną lub nie) natomiast gracz drugi
gra swoją j-tą strategię czystą, zatem
m
M (α, j ) = ∑ M i j α i
i =1
M (i , j ) = M i j
DEFINICJA 3.2.1
Grę <C, D, U> nazywamy rozszerzeniem gry <A, B, V> jeśli A⊆C , B⊆D oraz dla
kaŜdej pary strategii a∈A i b∈B zachodzi: V(a,b)=U(a,b)
Powiemy więc, Ŝe gra o sumie zero w strategiach mieszanych jest rozszerzeniem gry
w strategiach czystych
2
11/22/2014
Przykład (obliczanie wypłat dla danych strategiach mieszanych).
Wobec tego, Ŝe w nowej grze <A*,B*,M> moce zbiorów strategii są nieprzeliczalne
pojawiają się pewne problemy. Zacznijmy od zapisu definicji wartości dolnej i górnej
gry oraz strategii bezpieczeństwa graczy. Zgodnie z ogólną definicją α* i β * są
strategiami bezpieczeństwa gracz (I i II), gdy :
inf M (α*, β) = max inf M (α, β)
β
α
β
sup M (α, β*) = min sup M (α, β)
α
Liczby
w = sup inf M (α, β)
α
β
β
α
w = inf sup M (α, β)
β
α
oznaczają wartość dolną i górną dla gry <A*,B*,M>
Pojawiają się waŜne pytania. Jakie?
3
11/22/2014
KILKA WAśNYCH FAKTÓW.
LEMAT 3.2.1
Dla kaŜdej strategii β ∈B*:
sup M (α, β) = max M (i , β)
i
α
oraz dla kaŜdej strategii α∈A*:
inf M (α, β) = min M (α, j )
j
β
TWIERDZENIE 3.2.1
Dla dowolnej gry macierzowej <A*,B*,M> prawdziwe są wzory
w = sup min M (α, j )
α
j
w = inf max M (i, β)
β
i
WNIOSEK 3.2.2
Pomiędzy wartościami górnymi i dolnymi gier <A,B,M> oraz <A*,B*,M> zachodzą
następujące związki:
v≤w≤w ≤v
KILKA KOLEJNYCH WAśNYCH FAKTÓW.
TWIERDZENIE 3.2.2
JeŜeli gra <A*,B*,M> ma wartość oraz α*∈A* i β *∈B* są strategiami
bezpieczeństwa graczy w tej grze, to są one w równowadze
WNIOSEK 3.2.3
JeŜeli w grze <A*,B*,M> strategie α* i α' są strategiami bezpieczeństwa gracza I, a
strategie β * i β ' są strategiami bezpieczeństwa gracza II, to
M(α
α*,β
β ∗)=M(α
α*,β
β ')=M(α
α',β
β ')=M(α
α',β
β *)
i wszystkie wskazane pary strategii są w równowadze
TWIERDZENIE 3.2.3
JeŜeli w grze <A*,B*,M> strategie α*∈A* i β *∈B* są w równowadze to są one teŜ
strategiami bezpieczeństwa graczy w tej grze.
WNIOSEK 3.2.4
W grze <A*,B*,M> dowolne pary punktów równowagi są zamienne i równowaŜne.
4
11/22/2014
JESZCZE JEDEN WAśNY FAKT.
TWIERDZENIE 3.2.4
JeŜeli macierz M ma punkt siodłowy , to strategie czyste i0,j0 są strategiami
bezpieczeństwa w grze <A*,B*,M>
I WRESZCIE NAJWAśNIEJSZY FAKT.
TWIERDZENIE MINIMAKSOWE 3.3.1 (VON NEUMANN 1928)
i)
KaŜda gra macierzowa <A*,B*,M> ma wartość
ii)
KaŜdy z graczy ma co najmniej jedną strategię bezpieczeństwa
iii)
Dowolna para strategii bezpieczeństwa graczy jest w równowadze
iv)
Dowolna para strategii w równowadze tworzona jest przez strategie
bezpieczeństwa graczy
v)
Dowolne dwie pary strategii w równowadze są zamienne i równowaŜne
DEFINICJA 3.3.1
Rozwiązaniem gry macierzowej <A*,B*,M> nazywamy trójkę (α
α*,β
β *,w), gdzie
(α
α*,β
β *) to para strategii bezpieczeństwa graczy, a liczba w jest wartością gry.
TWIERDZENIE 3.3.2
Rozwiązanie gry o sumie zero nie zaleŜy od wyboru funkcji uzytecznosci dokonanego
przez graczy. Zmienia się jedynie - w oczywisty sposób - wartość gry.
5
11/22/2014
UWAGI NA TEMAT DOWODU TWIERDZENIA MINIMAKSOWEGO.
SCHEMAT ROZWIĄZYWANIA GIER O SUMIE ZEROWEJ.
Krok 1. Transformować macierz wypłat przez dodawanie stałej tak, by wszystkie jej
elementy były dodatnie : M' = [Mij + c]
Krok 2. Dla tak otrzymanej macierzy M ' sformułować zadanie programu liniowego problem dualny:
m
Q (x) = ∑ yi
Minimalizuj funkcje celu:
i =1
m
∑ M ij yi ≥ 1
przy warunkach ograniczających:
j = 1,K, n
i =1
i warunkach brzegowych:
yi ≥ 0
i = 1,K, m
Krok 3. Rozwiązać powyŜsze zadanie PL. Otrzymamy optymalne wartości y1,…,ym
oraz minimalną wartość funkcji Q, którą oznaczymy Qmin
SCHEMAT ROZWIĄZYWANIA GIER O SUMIE ZEROWEJ.
Krok 4. Obliczyć w', tj. wartość gry zadanej macierzą M ' wykorzystując związek:
w' =
1
Qmin
Krok 5. Obliczyć współrzędne αi* , i=1,…,m strategii bezpieczeństwa gracza I
podstawiając:
α i* = w' y i
Krok 6. Obliczyć wartość gry zadanej macierzą M jako róŜnicę w = w'- c.
6
11/22/2014
SCHEMAT ROZWIĄZYWANIA GIER O SUMIE ZEROWEJ.
Krok 7. Dla macierzy M ' sformułować zadanie programu liniowego- problem
pierwotny
Maksymalizuj funkcje celu:
m
F (x) = ∑ x j
i =1
n
przy warunkach ograniczających:
∑M
ij
xj ≤1
i = 1,K, m
j =1
i warunkach brzegowych:
xj ≥ 0
j = 1,K, n
Krok 8. Obliczyć współrzędne αi* , j=1,…,n strategii bezpieczeństwa gracza II
podstawiając:
β *j = w' x j
Przykład: Rozwiązanie gry pułkownika Blotto
7
11/22/2014
Gra pułkownika Blotto
- postać normalna
3 0
0
3
M1 = 
− 1 1

 1 −1
1
1 
2

2
− 3 0 − 1
 0 − 3 − 1

M2 =
 1 − 1 − 2


 − 1 1 − 2
Ostatecznie grę pułkownika Blotto zapisujemy jako grę o sumie zerowej
<A,B,M>, gdzie
3 0
0 3
M = M1 = 
− 1 1

 1 −1
1
1 
2

2
Rozwiązanie gry pułkownika Blotto
- sprowadzenie do zadania PL
PRZYPOMNIENIE
Rozwiązaniem gry macierzowej <A*,B*,M> nazywamy trójkę (α
α*,β
β *,w), gdzie
(α
α*,β
β *) to para strategii bezpieczeństwa graczy, a liczba w jest wartością gry.
Schemat rozwiązywania gier o sumie zerowej:
Krok 1. Transformować macierz wypłat przez dodawanie stałej
c, by wszystkie jej elementy były dodatnie
3 0
0 3
M =
− 1 1

 1 −1
1
1
2

2
 3+ 2 0+ 2
 0+ 2 3+ 2
M ' = [ M ij + c] = 
− 1 + 2 1 + 2

 1 + 2 −1 + 2
1 + 2  5
1 + 2  2
=
2 + 2  1
 
2 + 2 3
2 3
5 3
3 4

1 4
8
11/22/2014
5
2
M '= 
1

3
2 3
5 3
3 4

1 4
Krok 2. Aby otrzymać strategię bezpieczeństwa α∗=(
α∗ α1,α2,α3,α4)T pułkownika
Blotto(gracza I) formułujemy problem dualny zadania PL określony
następująco:
Minimalizuj funkcję celu : Q(y1, y2, y3, y4)= y1 + y2 + y3 + y4
Przy warunkach ograniczających:
5y1 + 2y2 + 1y3 + 3y4 ≥ 1
2y1 + 5y2 + 3y3 + 1y4 ≥ 1
3y1 + 3y2 + 4y3 + 4y4 ≥ 1
i warunkach brzegowych: yi ≥ 0, i=1,2,3,4
Krok 3. Uzyskujemy rozwiązanie powyŜszego zadania PL:
y1=7/48, y2=7/48, y3=1/16, y4=0
Wartość minimalna funkcji celu Qmin= 5/16
Krok 4. Obliczamy wartość gry zadanej macierzą M' wykorzystując
związek:
1
16
w' =
=
Qmin
5
Krok 5. Obliczamy współrzędne α i* , i=1,…,4 strategii bezpieczeństwa
Blotto (gracza I) podstawiając
α i* = w' y i
Otrzymujemy :
(α 1* , α 2* , α 3* , α 4* ) = (
Na przykład: α1* =
7 1 1
, , ,0)
15 3 5
16 7
7
⋅
=
5 48 15
9
11/22/2014
Krok 6. Obliczmy wartość gry zadanej macierzą M odejmując od wartości w'
stałą dodaną do elementów tej macierzy w kroku 1. Otrzymujemy:
w = w' - c = 16/5 - 2 = 6/5
Krok 7. Aby znaleźć strategię bezpieczeństwa gracza II formułujemy w
oparciu o macierz M ' zadanie programu liniowego - problem pierwotny
Maksymalizuj funkcje celu : F(x1, x2, x3)= x1 + x2 + x3
przy warunkach ograniczających:
5x1 + 2x2 + 3x3
2x1 + 5x2 + 3x3
1x1 + 3x2 + 4x3
3x1 + 1x2 + 4x3
≤1
≤1
≤1
≤1
5
2
M '= 
1

3
2 3
5 3
3 4

1 4
i warunkach brzegowych: xi ≥ 0, i=1,2,3.
Krok 8. Rozwiązujemy powyŜsze zadanie PL i otrzymujemy:
x1=1/16, x2=1/16, x3=3/16.
Współrzędne β i* , i=1,2,3, strategii bezpieczeństwa Attili (gracz II)
otrzymujemy mnoŜąc znalezioną wcześniej wartość w' przez współrzędne xi,
i=1,…,n, optymalnego rozwiązania zadania pierwotnego. Uzyskujemy strategie
bezpieczeństwa gracza II:
1 1 3
*
*
*
β *= ( β1 , β 2 , β 3 ) = ( , , )
5 5 5
Rozwiązanie gry: α*= (
1 1 3
7 1 1
, , ,0) , β *= ( , , ) , w=6/5
5 5 5
15 3 5
10
11/22/2014
Uwagi.
Blotto
Attila
Rozwiązanie wersji gry dla n=4, m = 3
Blotto
Attila
11