TEORIA GIER

Transkrypt

TEORIA GIER

TEORIA GIER
1. Wstęp
Teoria gier jest dziedziną zajmującą się opisem sytuacji, w których podmioty (gracze) podejmujący
świadome decyzje (nazywane strategie), w wyniku których zapadają rozstrzygnięcia mogące zmienić
ich położenie.
Teoria gier zajmuje się głównie sytuacjami konfliktowymi, ale także sytuacjami w których interesy
graczy są zgodne, ale z uwagi na problemy w porozumiewaniu się, trudno im ustalić właściwy sposób
postępowania.
W opisie każdej gry powinny wystąpić następujące elementy :
- wyszczególnienie uczestników gry,
- określenie możliwości postępowania każdego gracza,
- opis dostępnej graczom informacji,
- możliwe precyzyjne określenie celów do których dążą gracze.
Teoria gier prezentuje normatywne podejście do podejmowania decyzji, starając się wskazać
"racjonalne" sposoby postępowania, głównie w sytuacjach konfliktowych.
Świadomie zakłada, że uczestnicy gry są "racjonalni". To mocne założenie oznacza w szczególności,
że każdy z graczy posiada
- dowolnie duże możliwości obliczeniowe,
- doskonałą pamięć,
- umiejętność wskazania, który z wyników gry jest "lepszy".
Standardowo przyjmuje się założenie o wspólnej wiedzy graczy o ich racjonalności : oznacza to nie
tylko to, że każdy gracz wie, iż inni są racjonalni : musi on także wiedzieć, że każdy z graczy zdaje
sobie sprawę z racjonalności pozostałych graczy.
Oznacza to, że każdy z graczy jest w stanie określić strategie, które mogą wybrać inni gracze i
dostosować do tego swoje postępowanie, mając świadomość, że inni gracze postępują identycznie.
Wspólna wiedza dotyczy nie tylko zachowań (reguł postępowania), ale i samej gry : każdy zna jej
reguły i wypłaty (swoje i uczestników).
Wspólna wiedza o racjonalności nie musi prowadzić do zachowań, które postronny obserwator uznał
by za racjonalne. Może to wynikać z reguł gry, a nie "nieracjonalnych" zachowań graczy.
Nasze zainteresowania skupimy na sformalizowanym opisie sytuacji decyzyjnej w której gracze
(jednostki, przedsiębiorstwa, państwa) konkurują ze sobą dążąc do maksymalizacji swoich korzyści
(zysku, udziału w rynku itp.).
Korzyści graczy określa macierz wypłat postaci [aij , bij ] , gdzie a ij i bij są wypłatami (korzyściami)
gracza I i II w przypadku, gdy gracz I podjął decyzję i a gracz II decyzję j. Wygrana jednego z graczy
nie jest przegraną drugiego gracza (taka gra jest grą o sumie niezerowej). Jeżeli przegrana jednego
gracza jest wygraną drugiego, wówczas wypłatę określa macierz [aij ] (gra o sumie zerowej ;
bij = −aij ).
Wypłata gracza I zależy od jego decyzji (strategii) i oraz decyzji j podjętej przez gracza II
(konkurenta) i vice versa.
Wiersze macierzy wypłat odpowiadają strategii gracza I, a kolumny strategii gracza II.
1
J. Marcinkowski
Badania operacyjne
Znajomość macierzy wypłat zakłada możliwość określenia przez obie strony wypłat każdego z graczy
dla każdej kombinacji strategii.
Szukając rozwiązania gry, tj. kombinacji decyzji najkorzystniejszych dla obu graczy, zakłada się, że
każdy z nich dąży, zachowując się racjonalnie, do maksymalizacji własnych korzyści (a nie np. strat
przeciwnika).
2. Klasyfikacja gier
Klasyfikacji gier możemy dokonać ze względu na :
- liczbę uczestników gry, wyróżniając :
- gry dwuosobowe,
- gry n-osobowe,
- możliwości komunikowania się graczy, wyróżniając:
- gry kooperacyjne,
- gry niekooperacyjne,
- charakter gry, wyróżniając:
- gry rozgrywane jednokrotnie,
- gry rozgrywane wielokrotnie (gry sekwencyjne).
- rodzaj wypłat, wyróżniając:
- gry o sumie zerowej,
- gry sumie niezerowej,
- dostępną informację, wyróżniając:
- gry z pełną informacją,
- gry z niepełną informacją,
- liczbę strategii, wyróżniając:
- gry ze skończoną liczbą strategii,
- gry z nieskończoną liczbą strategii.
Przedmiotem naszego zainteresowania będą gry dwuosobowe o sumie niezerowej, rozgrywane
jednokrotnie, z pełną informacją i skończoną liczbą strategii.
3. Gry dwuosobowe o sumie niezerowej
Rozważmy dwuosobową, niekooperacyjną grę o następującej macierzy wypłat :
Firma II
A
Firma I
Wypłaty interpretujemy jako zyski z działalności
produkcyjnej. Strategia A - duża skala produkcji,
strategia B - mała skala produkcji. Zakładamy, że
dobra wytwarzane przez obie firmy są
komplementarne. Oznacza to, że zwiększenie
zbytu jednego dobra sprzyja zwiększeniu zbytu
B
A ⎡(500, 500) (300, 300) ⎤
⎢
⎥
B ⎣(250, 250) (125, 125)⎦
drugiego dobra
Strategią dominującą nazywamy strategię przynoszącą graczowi najwyższą wypłatę niezależnie od
strategii obranej przez konkurenta.
W naszym przypadku strategiami dominującymi jest para strategii (A,A). Kooperacja jest zbędna : nie
istnieje para strategii osiągalnych dzięki kooperacji, która dała by wyższą wypłatę niż para strategii
dominujących.
Strategie i* oraz j* nazywamy strategiami dominującymi, jeżeli spełnione są warunki :
∨ ∧ aij* ≥ aij
j * i ≠ i*
∨∧
i* j ≠ j *
i co najmniej dla jednego i aij* ≥ aij ,
bi* j ≥ bij i co najmniej dla jednego j bi* j > bij .
2
J. Marcinkowski
Badania operacyjne
Jeżeli obaj gracze posiadają strategie dominujące, to zazwyczaj je wybierają. Gra posiada stan
równowagi określony przez parę tych strategii. Jest on stabilny, gdyż żadnemu z graczy nie opłaca się
odstąpić od strategii dominującej, niezależnie od tego co zrobi konkurent.
Strategię dominującą może posiadać tylko jeden gracz, gra może nie mieć strategii dominujących.
II
A
II
B
A
A ⎡(500, 500) (300, 300) ⎤
⎢
⎥
B ⎣(600, 250) (125, 125)⎦
I
I
Gracz I nie ma strategii dominującej, dla
gracza II jest nią strategia A
B
A ⎡(500, 500) (300, 600) ⎤
⎢
⎥
B ⎣(600, 250) (125, 125)⎦
Żaden z graczy nie ma strategii dominującej
Jeżeli gra nie ma strategii dominujących, powstaje następujący problem : czy jest możliwe
zdefiniowanie pojęcia równowagi?
Nash zaproponował słabszą koncepcję równowagi, nie opartej na układzie strategii dominujących.1
II
C
I
D
C ⎡(350, 350)
⎢
D ⎣(300, 450)
(350, 300) ⎤
(400, 400)⎥⎦
Powiemy, że strategie graczy tworzą równowagę Nasha, jeżeli maksymalizują wypłatę gracza przy
danym wyborze drugiego gracza.
Oznacza to, że jeżeli każdy z graczy dokonał wyboru, to żadnemu z nich nie opłaca się
odstąpić od wybranej strategii.
W naszym przypadku strategiami tymi są strategie (C, C). Jeżeli gracz I wybierze strategię C, to
graczowi drugiemu nie opłaca się odstępstwo (bo 300 < 350). Jeżeli gracz II wybierze C, to graczowi
I także nie opłaca się dokonanie odstępstwa.
Powiemy, że strategie i* oraz j* pozostają w równowadze Nasha, jeżeli spełnione są warunki :
∧ ai* j* ≥ aij* i dla co najmniej jednego i ai* j* > aij* ,
i ≠ i*
∧
j ≠ j*
bi* j* ≥ bi* j i dla co najmniej jednego j bi* j* > bi* j .
W zależności od struktury macierzy wypłat może istnieć jedna równowaga Nasha, wiele równowag
Nasha, bądź też może nie być takiej równowagi.
II
C
I
C ⎡(350, 350)
⎢
D ⎣(400, 450)
II
D
C
(350, 400) ⎤
(300, 400)⎥⎦
I
Dwie równowagi Nasha : (C,D) i (D,C).
Równowaga (D,C) jest bardziej korzystna dla
każdego z graczy (400 > 350, 450 > 400)
D
C ⎡(700, 500) (300, 600) ⎤
⎢
⎥
D ⎣(600, 250) (400, 125)⎦
Brak równowagi Nasha
W przypadku istnienia więcej niż jednej równowagi Nasha, brak jest jednoznacznego rozwiązania gry.
1
Istnieje wiele innych koncepcji równowagi, które nie będą przedmiotem naszego zainteresowania
3
J. Marcinkowski
Badania operacyjne
Jeżeli jedna z równowag Nasha jest korzystniejsza dla każdego gracza, obaj gracze wybiorą ją, nie
mając nawet możliwości porozumienia się. Może się zdarzyć, że jedna z równowag jest
korzystniejsza dla jednego z graczy, druga dla drugiego. Trudno wtedy o sensowny wybór.
Równowaga określona przez strategie dominujące nazywana jest równowagą globalną, równowaga w
sensie Nasha - lokalną (warunkową).
Jeżeli gra posiada równowagę w sensie Nasha i jeden z graczy od niej odstąpi (np. w wyniku błędu),
drugiemu także może opłacać się odstępstwo.
Jeżeli gra posiada rozwiązanie w sensie strategii dominujących, to maksymalizacja korzyści
indywidualnych przy odpowiedniej strukturze macierzy wypłat prowadzi do maksymalizacji korzyści
zbiorowej (łącznej korzyści obu graczy będącej sumą wypłat każdego nich).
W pozostałych przypadkach maksymalizacja korzyści indywidualnych nie prowadzi do
maksymalizacji łącznej korzyści obu graczy. Dążenie do maksymalizacji korzyści indywidualnych
może prowadzić do podejmowania decyzji nie tylko nie maksymalizujących łącznej wypłaty graczy,
ale także wypłat każdego nich (np. dylemat więźnia). Stanowi to argument przemawiający na rzecz
interwencjonizmu, gdyż nie w każdych warunkach swobodna gra rynkowa musi prowadzić do
maksymalizacji korzyści jej uczestników.
4. Dylemat więźnia
Opisuje sytuacje, kiedy dążenie do maksymalizacji korzyści indywidualnych prowadzi do
niekorzystnych rozwiązań dla każdego z graczy.
II
W
Z
W ⎡( N , N ) ( F , P ) ⎤
I
⎢
⎥
Z ⎣( P, F ) ( K , K ) ⎦
Wypłaty : P - pokusa, N - nagroda, K - kara, F - frajer,
P > N > K > F.
Strategie : W - współpraca, Z - zdrada.
Strategiami dominującymi dla gracza I i II jest zdrada (P > N, K > F). Wyznaczają one punkt
równowagi globalnej.
Przy założeniu braku możliwości kooperacji, interes własny każdego graczy dyktuje wybór strategii
dominującej.
Gdy kooperacja jest możliwa, obaj gracze mogą poprawić swoją wypłatę z K do N. Rozwiązanie
(N, N) maksymalizujące wypłaty obu graczy jest niestabilne. Jeżeli np. gracz I zakłada, że po
osiągnięciu porozumienia gracz II zachowa się lojalnie, będzie skłonny do odstępstwa - jego wypłata
wzrośnie z N do P. Podobnie rozumuje gracz II, co bardzo utrudnia kooperację.
Kooperacja jest tym trudniejsza, im większą wartość mają różnice P − N oraz N − F . W
pierwszym przypadku pojawia się zachęta do zdrady, w drugim obawa przed byciem zdradzonym.
Teoria gier zajmuje się tym, jak powinni zachowywać się racjonalnie postępujący gracze, natomiast
psychologia behawioralna zajmuje się badaniem rzeczywistych zachowań ludzi. Badania te polegają
na obserwacji w warunkach laboratoryjnych, jakie strategie obierają ludzie rozgrywający gry o
różnych macierzach wypłat w zależności od struktury macierzy wypłat, dysponujący lub nie pełną
informacją, mający nożliwość porozumiewania się, względnie pozbawieni tej możliwości.
Eksperymenty dokonywane przez psychologów behawioralnych dowodzą, że możliwość wymiany
informacji i powtarzalność gry sprzyja kooperacji. W przypadku rozgrywki jednokrotnej bez
możliwości wymiany informacji badani wybierali strategie dominujące. W przypadku rozgrywki
wielokrotnej bez możliwości wymiany informacji odpowiedzią na dokonanie odstępstwa przez
jednego graczy było dokonanie odstępstwa przez drugiego gracza (kara). Świadomość kosztów
nielojalności skłaniała po szeregu rozgrywkach każdego z graczy do wyboru strategii N. Zachowania
kooperacyjne pojawiały się wcześniej i częściej, gdy badanym stworzono możliwość porozumiewania
się.
4
J. Marcinkowski
Badania operacyjne
5. Przykłady zastosowań
1. Ustalania ceny (duopol Carnota)
Dylemat więźnia trafnie opisuje relacje zachodzące miedzy duopolistami będące wypadkową
tendencji do rywalizacji i kooperacji.
II
Macierz wypłat opisuje zyski duopolistów wytwarzających
W
N
ten sam wyrób.
W ⎡(10, 10) (5, 12)⎤
I
Strategie : W - wysoka cena, N - niska cena sprzedaży.
⎢
⎥
N ⎣(12, 5)
(7, 7)⎦
Jeżeli jeden z duopolistów zdecyduje się na sprzedaż po niskiej cenie a drugi po wysokiej, to pierwszy
będzie osiągał niższy zysk jednostkowy, ale zwiększona sprzedaż spowoduje wzrost zysku. Zakłada
się, że klient nie jest przywiązany do marki. Jeżeli obaj będą współpracować, to manipulując ceną
będą realizować większe zyski niż w przypadku braku współpracy (przybierającej w skrajnym
przypadku postać wojny cenowej).
Przy braku możliwości porozumienia duopoliści wybiorą sprzedaż po niskiej cenie osiągając łączny
zysk równy 7+7=14. Gdyby doszli do porozumienia, każdy z nich mógłby osiągnąć zysk o 3 większy,
zysk łączny = 10+10 = 20 (różnica 20-14 jest zyskiem monopolisty). Strategia (W, W) nie jest stabilna
w przeciwieństwie do strategii (N, N). Strategia (N, N) jest stabilna : gracz odstępujący od tej strategii
przy założeniu, że drugi gracz pozostaje przy strategii N ponosi stratę : jego wyplata zmniejsza się z 7
do 5. Gracz nie dokonujący odstępstwa zyskuje : jego wypłata ulega zwiększeniu z 7 do 12.
Kooperacji sprzyja :
- łatwa kontrola przez konkurenta,
- możliwość retorsji w przypadku braku kooperacji.
W przypadku karteli macierz wypłat ma strukturę dylematu więźnia, co tłumaczy ich potencjalną
niestabilność.
2. Walka o standard HDTV (High Definition Television)
W macierzy podano wypłaty : przychody wyrażone w mld dol. w przypadku przyjęcia standardu
emisji HDTV proponowanego przez firmy japońskie i amerykańskie. W przypadku ustalenia jednego
standardu można oczekiwać dużych przychodów równych 150 mld dol. (100 + 50 = 60+90 = 150), co
wynika z kompatybilności oferowanych urządzeń. Jeżeli nie dojdzie do porozumienia i będą
obowiązywały dwa standardy, wówczas sprzedaż urządzeń będzie wyraźnie mniejsza, wynosząc 50
mld dol. (20 + 30). Jest oczywiste, że firmy amerykańskie nie przyjmą dobrowolnie standardu
japońskiego i vice versa - dlatego w macierzy wypłat pojawia się element (0,0).
II
J
I
A
J ⎡(100, 50) (30, 20)⎤
⎢
(60, 90) ⎥⎦
A ⎣(0, 0)
Gracze : I - firmy japońskie, II - firmy amerykańskie.
Strategie : J - przyjąć standard japoński, A - przyjąć standard
amerykański.
Istnieją dwa stany równowagi w sensie Nasha : (100, 50) i (60, 90), ale przy każdym z nich korzyści
są różnie rozłożone, co wymaga negocjacji - każda ze stron chce osiągnąć korzystniejszy dla siebie
stan równowagi. Przy dużych różnicach korzyści każdej ze stron w stanach równowagi (100 i 60, 50 i
90) porozumienie może być nieosiągalne. Jeżeli jednak jedna ze stron narzuci swój standard i będzie
w stanie opanować rynek - to druga strona musi się do niego dostosować. Istotnie, gdy np. firmy
japońskie narzucą swój standard, to firmy amerykańskie akceptując go uzyskają przychód w
wysokości 50 mld dol. Gdyby trwały przy swoim standardzie, to zostaną wyeliminowane z rynku. (co
nie wynika z macierzy wypłat!). Macierz wypłat nie informuje bowiem o przebiegu rozgrywki.
Sugeruje - fałszywie - że upór jest celowy, gdyż firmy amerykańskie nie rezygnując ze swojego
standardu tracą 30 mld. dol. (50 - 20), a japońskie 70 mld dol. (100 - 30), co mogło by skłonić firmy
japońskie do pertraktacji. Dlatego stosunki między firmami są wypadkową tendencji do rywalizacji i
kooperacji.
5

TEORIA GIER

Transkrypt

Podobne dokumenty

Zostań hersztem piratów! Buduj swoją piracką flotę

Liczba graczy: 1

Lippi: Sabatini pytał mnie o graczy z Azji

Drukowanie strony

MODELE TEORII GIER

Rozdział 2 Algorytmy szukania równowag w grach dwumacierzowych