Gry o sumie zero Gry o sumie zero - gry rozgrywane w strategiach
Transkrypt
Gry o sumie zero Gry o sumie zero - gry rozgrywane w strategiach
11/22/2014 Gry o sumie zero gry rozgrywane w strategiach mieszanych STRATEGIE MIESZANE - MOTYWACJA. ROZWAśMY PRZYKŁAD: − 1 5 2 − 3 DEFINICJA 2.3.6 Strategią mieszaną π gracza P nazywamy kaŜdy rozkład prawdopodobieństwa określony na zbiorze S jego strategii czystych. W grach macierzowych, w których zbiory strategii czystych są skończone, rozkłady prawdopodobieństwa mogą być utoŜsamiane z wektorami o nieujemnych współrzędnych sumujących się do jedności. RozwaŜmy zatem grę <A, B, M>, w której gracz I ma m zaś gracz II ma n strategii czystych. Wtedy zbiory A*, B* strategii mieszanych graczy są następujące m A* = {α = (α1 ,K,α m ) : ∑ α i = 1, ∀ i = 1,K, m, α i ≥ 0} i =1 n B* = {β = ( β1 ,K, β n ) : ∑ β i = 1, ∀ i = 1,K, n, β i ≥ 0} j =1 1 11/22/2014 Zachodzą waŜne relacje: A ⊆ A* oraz B ⊆ B*, gdyŜ strategie czyste moŜemy utoŜsamiać z rozkładami skoncentrowanymi w jednym punkcie: ai ≡ (0, K ,0,1,0, K,0) b j ≡ (0, K ,0,1,0,K ,0) PoniewaŜ wypłaty graczy podane są za pomocą ich funkcji uŜyteczności, a wybory strategii dokonywane przez graczy są od siebie niezaleŜne, zatem łatwo moŜemy rozszerzyć definicje funkcji wypłaty M tak, by była określona na całym zbiorze strategii mieszanych. m n m n M (α, β) = αMβ T = ∑∑ M (ai , b j )α i β j = ∑∑ M i jα i β j i =1 j =1 i =1 j =1 W przypadku gdy będziemy chcieli podkreślić, Ŝe gracz uŜywa strategię czystą, w funkcji wypłaty będziemy wpisywali jedynie jej numer. Na przykład M(α , j) oznacza, Ŝe gracz I gra pewną strategię α (mieszaną lub nie) natomiast gracz drugi gra swoją j-tą strategię czystą, zatem m M (α, j ) = ∑ M i j α i i =1 M (i , j ) = M i j DEFINICJA 3.2.1 Grę <C, D, U> nazywamy rozszerzeniem gry <A, B, V> jeśli A⊆C , B⊆D oraz dla kaŜdej pary strategii a∈A i b∈B zachodzi: V(a,b)=U(a,b) Powiemy więc, Ŝe gra o sumie zero w strategiach mieszanych jest rozszerzeniem gry w strategiach czystych 2 11/22/2014 Przykład (obliczanie wypłat dla danych strategiach mieszanych). Wobec tego, Ŝe w nowej grze <A*,B*,M> moce zbiorów strategii są nieprzeliczalne pojawiają się pewne problemy. Zacznijmy od zapisu definicji wartości dolnej i górnej gry oraz strategii bezpieczeństwa graczy. Zgodnie z ogólną definicją α* i β * są strategiami bezpieczeństwa gracz (I i II), gdy : inf M (α*, β) = max inf M (α, β) β α β sup M (α, β*) = min sup M (α, β) α Liczby w = sup inf M (α, β) α β β α w = inf sup M (α, β) β α oznaczają wartość dolną i górną dla gry <A*,B*,M> Pojawiają się waŜne pytania. Jakie? 3 11/22/2014 KILKA WAśNYCH FAKTÓW. LEMAT 3.2.1 Dla kaŜdej strategii β ∈B*: sup M (α, β) = max M (i , β) i α oraz dla kaŜdej strategii α∈A*: inf M (α, β) = min M (α, j ) j β TWIERDZENIE 3.2.1 Dla dowolnej gry macierzowej <A*,B*,M> prawdziwe są wzory w = sup min M (α, j ) α j w = inf max M (i, β) β i WNIOSEK 3.2.2 Pomiędzy wartościami górnymi i dolnymi gier <A,B,M> oraz <A*,B*,M> zachodzą następujące związki: v≤w≤w ≤v KILKA KOLEJNYCH WAśNYCH FAKTÓW. TWIERDZENIE 3.2.2 JeŜeli gra <A*,B*,M> ma wartość oraz α*∈A* i β *∈B* są strategiami bezpieczeństwa graczy w tej grze, to są one w równowadze WNIOSEK 3.2.3 JeŜeli w grze <A*,B*,M> strategie α* i α' są strategiami bezpieczeństwa gracza I, a strategie β * i β ' są strategiami bezpieczeństwa gracza II, to M(α α*,β β ∗)=M(α α*,β β ')=M(α α',β β ')=M(α α',β β *) i wszystkie wskazane pary strategii są w równowadze TWIERDZENIE 3.2.3 JeŜeli w grze <A*,B*,M> strategie α*∈A* i β *∈B* są w równowadze to są one teŜ strategiami bezpieczeństwa graczy w tej grze. WNIOSEK 3.2.4 W grze <A*,B*,M> dowolne pary punktów równowagi są zamienne i równowaŜne. 4 11/22/2014 JESZCZE JEDEN WAśNY FAKT. TWIERDZENIE 3.2.4 JeŜeli macierz M ma punkt siodłowy , to strategie czyste i0,j0 są strategiami bezpieczeństwa w grze <A*,B*,M> I WRESZCIE NAJWAśNIEJSZY FAKT. TWIERDZENIE MINIMAKSOWE 3.3.1 (VON NEUMANN 1928) i) KaŜda gra macierzowa <A*,B*,M> ma wartość ii) KaŜdy z graczy ma co najmniej jedną strategię bezpieczeństwa iii) Dowolna para strategii bezpieczeństwa graczy jest w równowadze iv) Dowolna para strategii w równowadze tworzona jest przez strategie bezpieczeństwa graczy v) Dowolne dwie pary strategii w równowadze są zamienne i równowaŜne DEFINICJA 3.3.1 Rozwiązaniem gry macierzowej <A*,B*,M> nazywamy trójkę (α α*,β β *,w), gdzie (α α*,β β *) to para strategii bezpieczeństwa graczy, a liczba w jest wartością gry. TWIERDZENIE 3.3.2 Rozwiązanie gry o sumie zero nie zaleŜy od wyboru funkcji uzytecznosci dokonanego przez graczy. Zmienia się jedynie - w oczywisty sposób - wartość gry. 5 11/22/2014 UWAGI NA TEMAT DOWODU TWIERDZENIA MINIMAKSOWEGO. SCHEMAT ROZWIĄZYWANIA GIER O SUMIE ZEROWEJ. Krok 1. Transformować macierz wypłat przez dodawanie stałej tak, by wszystkie jej elementy były dodatnie : M' = [Mij + c] Krok 2. Dla tak otrzymanej macierzy M ' sformułować zadanie programu liniowego problem dualny: m Q (x) = ∑ yi Minimalizuj funkcje celu: i =1 m ∑ M ij yi ≥ 1 przy warunkach ograniczających: j = 1,K, n i =1 i warunkach brzegowych: yi ≥ 0 i = 1,K, m Krok 3. Rozwiązać powyŜsze zadanie PL. Otrzymamy optymalne wartości y1,…,ym oraz minimalną wartość funkcji Q, którą oznaczymy Qmin SCHEMAT ROZWIĄZYWANIA GIER O SUMIE ZEROWEJ. Krok 4. Obliczyć w', tj. wartość gry zadanej macierzą M ' wykorzystując związek: w' = 1 Qmin Krok 5. Obliczyć współrzędne αi* , i=1,…,m strategii bezpieczeństwa gracza I podstawiając: α i* = w' y i Krok 6. Obliczyć wartość gry zadanej macierzą M jako róŜnicę w = w'- c. 6 11/22/2014 SCHEMAT ROZWIĄZYWANIA GIER O SUMIE ZEROWEJ. Krok 7. Dla macierzy M ' sformułować zadanie programu liniowego- problem pierwotny Maksymalizuj funkcje celu: m F (x) = ∑ x j i =1 n przy warunkach ograniczających: ∑M ij xj ≤1 i = 1,K, m j =1 i warunkach brzegowych: xj ≥ 0 j = 1,K, n Krok 8. Obliczyć współrzędne αi* , j=1,…,n strategii bezpieczeństwa gracza II podstawiając: β *j = w' x j Przykład: Rozwiązanie gry pułkownika Blotto 7 11/22/2014 Gra pułkownika Blotto - postać normalna 3 0 0 3 M1 = − 1 1 1 −1 1 1 2 2 − 3 0 − 1 0 − 3 − 1 M2 = 1 − 1 − 2 − 1 1 − 2 Ostatecznie grę pułkownika Blotto zapisujemy jako grę o sumie zerowej <A,B,M>, gdzie 3 0 0 3 M = M1 = − 1 1 1 −1 1 1 2 2 Rozwiązanie gry pułkownika Blotto - sprowadzenie do zadania PL PRZYPOMNIENIE Rozwiązaniem gry macierzowej <A*,B*,M> nazywamy trójkę (α α*,β β *,w), gdzie (α α*,β β *) to para strategii bezpieczeństwa graczy, a liczba w jest wartością gry. Schemat rozwiązywania gier o sumie zerowej: Krok 1. Transformować macierz wypłat przez dodawanie stałej c, by wszystkie jej elementy były dodatnie 3 0 0 3 M = − 1 1 1 −1 1 1 2 2 3+ 2 0+ 2 0+ 2 3+ 2 M ' = [ M ij + c] = − 1 + 2 1 + 2 1 + 2 −1 + 2 1 + 2 5 1 + 2 2 = 2 + 2 1 2 + 2 3 2 3 5 3 3 4 1 4 8 11/22/2014 5 2 M '= 1 3 2 3 5 3 3 4 1 4 Krok 2. Aby otrzymać strategię bezpieczeństwa α∗=( α∗ α1,α2,α3,α4)T pułkownika Blotto(gracza I) formułujemy problem dualny zadania PL określony następująco: Minimalizuj funkcję celu : Q(y1, y2, y3, y4)= y1 + y2 + y3 + y4 Przy warunkach ograniczających: 5y1 + 2y2 + 1y3 + 3y4 ≥ 1 2y1 + 5y2 + 3y3 + 1y4 ≥ 1 3y1 + 3y2 + 4y3 + 4y4 ≥ 1 i warunkach brzegowych: yi ≥ 0, i=1,2,3,4 Krok 3. Uzyskujemy rozwiązanie powyŜszego zadania PL: y1=7/48, y2=7/48, y3=1/16, y4=0 Wartość minimalna funkcji celu Qmin= 5/16 Krok 4. Obliczamy wartość gry zadanej macierzą M' wykorzystując związek: 1 16 w' = = Qmin 5 Krok 5. Obliczamy współrzędne α i* , i=1,…,4 strategii bezpieczeństwa Blotto (gracza I) podstawiając α i* = w' y i Otrzymujemy : (α 1* , α 2* , α 3* , α 4* ) = ( Na przykład: α1* = 7 1 1 , , ,0) 15 3 5 16 7 7 ⋅ = 5 48 15 9 11/22/2014 Krok 6. Obliczmy wartość gry zadanej macierzą M odejmując od wartości w' stałą dodaną do elementów tej macierzy w kroku 1. Otrzymujemy: w = w' - c = 16/5 - 2 = 6/5 Krok 7. Aby znaleźć strategię bezpieczeństwa gracza II formułujemy w oparciu o macierz M ' zadanie programu liniowego - problem pierwotny Maksymalizuj funkcje celu : F(x1, x2, x3)= x1 + x2 + x3 przy warunkach ograniczających: 5x1 + 2x2 + 3x3 2x1 + 5x2 + 3x3 1x1 + 3x2 + 4x3 3x1 + 1x2 + 4x3 ≤1 ≤1 ≤1 ≤1 5 2 M '= 1 3 2 3 5 3 3 4 1 4 i warunkach brzegowych: xi ≥ 0, i=1,2,3. Krok 8. Rozwiązujemy powyŜsze zadanie PL i otrzymujemy: x1=1/16, x2=1/16, x3=3/16. Współrzędne β i* , i=1,2,3, strategii bezpieczeństwa Attili (gracz II) otrzymujemy mnoŜąc znalezioną wcześniej wartość w' przez współrzędne xi, i=1,…,n, optymalnego rozwiązania zadania pierwotnego. Uzyskujemy strategie bezpieczeństwa gracza II: 1 1 3 * * * β *= ( β1 , β 2 , β 3 ) = ( , , ) 5 5 5 Rozwiązanie gry: α*= ( 1 1 3 7 1 1 , , ,0) , β *= ( , , ) , w=6/5 5 5 5 15 3 5 10 11/22/2014 Uwagi. Blotto Attila Rozwiązanie wersji gry dla n=4, m = 3 Blotto Attila 11