Opracowanie narzędzi analitycznych do

Transkrypt

Instytut Łączności
Praca statutowa
nr 11.30.004.6
Opracowanie narzędzi analitycznych do wspomagania decyzji
dotyczących wysokości opłat taryfikacyjnych i stawek
rozliczeniowych na konkurencyjnym rynku telekomunikacyjnym
Kontynuacja
dr inż. Sylwester Laskowski
Konsultacje:
prof. dr hab. inż. Andrzej P. Wierzbicki
Warszawa, grudzień 2006.
ii
Spis treści
Wprowadzenie
ix
1 Analiza zależności pomiędzy ustaloną, a preferowaną kolejnością ruchów w
grze pojedynczej
1
2 Ustalona kolejność ruchów – gracz A zna sposób rozegrania gry pojedynczej
przez gracza B
2.1
2.2
7
Pierwszym ruchem w grze podwójnej jest proces negocjacji stawek rozliczeniowych
na rynku hurtowym – H . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8
2.1.1
W grze pojedynczej pierwszy rusza się gracz A (przypadek HAB)
. . . .
9
2.1.2
W grze pojedynczej pierwszy rusza się gracz B (przypadek HBA) . . . .
15
Pierwszym ruchem w grze podwójnej jest proces ustalania cen na rynku detalicznym gracza A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
2.2.1
Metoda wyboru strategii . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
2.2.2
Przykład zastosowania metody . . . . . . . . . . . . . . . . . . . . . . . .
30
3 Ustalona kolejność ruchów – gracz A nie zna sposóbu rozegrania gry pojedynczej przez gracza B
3.1
3.2
41
Pierwszym ruchem w grze podwójnej jest proces negocjacji stawek rozliczeniowych
na rynku hurtowym – H . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
42
3.1.1
W grze pojedynczej pierwszy rusza się gracz A: przypadek HAB . . . . .
42
3.1.2
W grze pojedynczej pierwszy rusza się gracz B: przypadek HBA . . . . .
54
Pierwszym ruchem w grze podwójnej jest proces ustalania cen na rynku detalicznym gracza A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
90
4 Możliwość kształtowania kolejności ruchów w grze podwójnej
93
Zakończenie
97
iii
Bibliografia
100
iv
Spis tabel
1
Ilustracja pojęć strategia i wypłata.
. . . . . . . . . . . . . . . . . . . . . . . . .
1.1
Macierz wypłat graczy A i B w grze podwójnej, w której opłaca się graczowi A
ukształtować grę pojedynczą, jako grę z preferencją drugiego. . . . . . . . . . . .
1.2
. . . . . . . . .
. . . . . . . . .
2.1
Macierz wypłat graczy A i B w grze podwójnej.
2.2
Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w trakcie negocjacji
wybrana zostanie strategia h1 .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
6
10
10
Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w trakcie negocjacji
wybrana zostanie strategia h2 .
2.4
6
Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w grze podwójnej
została wybrana strategia h2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3
5
1.9
4
ukształtować grę pojedynczą, jako grę z preferencją pierwszego.
1.8
4
1.7
4
1.6
3
ukształtować grę pojedynczą, jako grę z preferencją pierwszego.
1.5
3
1.4
2
1.3
x
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
Macierz wypłat graczy A i B, której struktura umożliwia graczowi B stosowanie
gróźb w trakcie negocjacji w grze podwójnej. . . . . . . . . . . . . . . . . . . . .
v
12
2.5
Zmodyfikowana macierz wypłat w grze h2 .
2.6
Macierz wypłat graczy A i B, której struktura umożliwia graczowi B stosowanie
. . . . . . . . . . . . . . . . . . . . .
13
gróźb w trakcie negocjacji w grze podwójnej. . . . . . . . . . . . . . . . . . . . .
14
2.7
Zmodyfikowana macierz wypłat w grze h2 .
14
2.8
Macierz wypłat w grze, w której gracz A powinien złożyć obietnicę, iż w przypa-
. . . . . . . . . . . . . . . . . . . . .
dku wybrania strategii h2 , wybierze strategię a2 . . . . . . . . . . . . . . . . . . .
15
Macierz wypłat w grze z ustaloną kolejnością HBA. . . . . . . . . . . . . . . . .
16
2.10 Macierz wypłat w grze pojedynczej. . . . . . . . . . . . . . . . . . . . . . . . . .
21
2.9
2.11 Przykład gry, w której decyzja gracza A prowokuje gracza B do zmiany celu z
indywidualnie efektywnego na antagonistyczny. . . . . . . . . . . . . . . . . . . .
23
2.12 Ilustracja gry podwójnej, w której pierwszym ruchem jest ustalenie przez gracza A
cen na rynku detalicznym, jako modelu gry przeciwko naturze, której strategiami
są możliwe do przyjęcia przez obu graczy wyniki procesu negocjacji hl .
. . . . .
29
2.13 Gra podwójna na rynku lokalnym. . . . . . . . . . . . . . . . . . . . . . . . . . .
31
2.14 Macierz wypłat z gry pojedynczej a1 .
. . . . . . . . . . . . . . . . . . . . . . . .
32
. . . . . . . . . . . . . . . . . . . . . . . .
34
. . . . . . . . . . . . . . . . . . . . . . . .
35
3.1
Macierz wypłat w grze z ustaloną kolejnością HAB, w której gracz A nie zna
sposobu rozegrania gry przez gracza B.
. . . . . . . . . . . . . . . . . . . . . . .
44
3.2
Odwaga gry w sposób antagonistyczny przez gracza B.
. . . . . . . . . . . . . .
57
3.3
Trudność z odczytaniem motywacji gracza B: mądrość, czy antagonizm?. . . . .
57
3.4
Obawa gry w sposób antagonistyczny przez gracza B. . . . . . . . . . . . . . . .
58
3.5
Niepożądane z puntku widzenia gracza A dążenie gracza B do celu indywidualnie
efektywnego. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.6
59
Przykład gry, w której korzystnym dla obu graczy jest poinformowanie gracza B
na temat antagonistycznego celu, do jakiego dąży gracz A.
. . . . . . . . . . . .
60
3.7
Korzystna niewiarygodność.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
62
3.8
Zbieżność antagonizmów. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
65
3.9
Przykład gry, w której maksymalnie antagonistyczny cel gracza A jest dla gracza
B korzystny.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
66
3.10 Przykład gry, w której minimalnie antagonistyczny cel gracza A stanowić może
najbardziej skuteczne narzędzie utrudnienia graczowi B realizacji jego celu. . . .
vi
67
3.11 Przykład gry, w której minimalnie antagonistyczny cel gracza A stanowić może
najbardziej skuteczne narzędzie utrudnienia graczowi B realizacji jego celu. Cel
maksymalnie i minimalnie antagonistyczny gracza A nie wskazują na tę samą
strategię ai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
3.12 Przykład gry, w której gracza B korzystna na fakcie, iż gracz A wysunął wobec
niego groźbę. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
69
3.13 Macierz wypłat w grze podwójnej. . . . . . . . . . . . . . . . . . . . . . . . . . .
71
3.14 Macierz skalarnych wartości poszczególnych wyników gry, odzwieciedlających indywidualnie efektywny cel gracza A. . . . . . . . . . . . . . . . . . . . . . . . . .
72
3.15 Macierz wypłat w grze przeciwko naturze, uzyskana z macierzy skalarnych wartości poszczególnych wyników gry. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
73
74
78
83
4.1
Macierz wypłat w grze pierwotnej. . . . . . . . . . . . . . . . . . . . . . . . . . .
95
4.2
Macierz wypłat w grze przekształconej. . . . . . . . . . . . . . . . . . . . . . . .
95
vii
viii
Wprowadzenie
Niniejsze opracowanie stanowi kontynuację studiów Autora nad tematyką strategicznych gier
rynkowych, w celu wypracowania narzędzi analitycznych, użytecznych dla graczy rynkowych w
procesie ustalania cen na rynku detalicznym jak też wspomagających w procesie negocjowania
stawek rozliczeniowych na rynku hurtowym. Opracowanie jest bezpośrednią kontynuacją prac o
tym samym tytule realizowanych w latach 2004 - 2005.
W rozumieniu teorii gier [17, 21, 22] sytuację konkurencji na rynku usług telekomunikacyjnych traktować należy jako wielokryterialną, wieloosobową grę o sumie niezerowej [4], w której
poszczególni gracze, przedsiębiorstwa telekomunikacyjne dążą do realizacji określonej polityki.
Miarę stopnia realizacji tej polityki stanowią określone kryteria oceny (funkcje wypłaty) takie
jak zysk, udział w rynku, jakość świadczonych usług, wielkość ponoszonych kosztów czy wielkość
generowanego ruchu. Szczególnym przypadkiem jest sytuacja, w której dane przedsiębiorstwo w
sposób istotny rozpatruje tylko jedno z kryteriów oceny. W rozumieniu teorii gier sytuację tę
określimy jako grę jednokryterialną. Wartość funkcji wypłaty w jednokryterialnej grze rynkowej
zależy bezpośrednio od decyzji podjętej przed dane przedsiębiorstwo (danego gracza). W wielu
przypadkach wartość ta uzależniona jest również od decyzji konkurentów. Decyzje graczy dotyczące sposobu rozegrania gry rynkowej nazywamy strategiami gry. Tabela 1 ilustruje wzajemną
zależność między pojęciami strategii i wypłaty dla dwóch graczy - gracza A i gracza B. Jest to
tzw. macierz wypłat. W macierzy tej zilustrowano wypłaty zarówno gracza A, jak i gracza B.
Gracz A ma tu do wyboru cztery strategie a1 , a2 , a3 i a4 . Gracz B natomiast strategie b1 , b2 , b3
i b4 . Jeśli gracz A wybierze strategię ai , a gracz B strategię bj , to otrzymają oni w ten sposób
A i V B.
wypłaty - odpowiednio Vi,j
i,j
Przyjmujemy, iż funkcja wypłaty bazuje na modelu popytu świadczonych usług i/lub modelu
ponoszonych z tego tytułu kosztów. Przykładem tego rodzaju gry rynkowej jest gra o maksymalizację zysku, o maksymalizację udziału w rynku, czy minimalizację ponoszonych kosztów. Zgodnie z dotychczasową konwencją dla określenia strategii gry wprowadzimy następującą definicję:
Definicja 0.0.1 Jednostką usługową - SUAnpm nazywamy elementarną część m usługi bądź
ix
Tabela 1: Ilustracja pojęć strategia i wypłata.
b1
b2
b3
..
.
b4
......
......
A , VB ]
[V2,3
2,3
..
.
..
.
......
a1
a2
a3
a4
usług, świadczonych przez przedsiębiorstwo A, w n-tej strefie numeracyjnej, dla użytkownika o
profilu p, z którą związana jest pobierana od użytkownika opłata PAnpm .
Korzystając z powyższej definicji jednostki usługowej SUAnpm oraz odpowiadającej jej ceny
PAnpm zdefiniujemy pojęcie strategii:
i
Definicja 0.0.2 Strategią ai przedsiębiorstwa A nazywamy zbiór par {(SUAnpm , PAnpm
)}.
W niniejszym opracowaniu skupiono uwagę na tzw. grze podwójnej. W grze tej udział bierze
dwóch rzeczywistych graczy (przedsiębiorstwa telekomunikacyjne): gracz A, którego strategiami
są jego (A) ceny na rynku detalicznym (ai ) oraz gracz B, którego strategiami są jego (B) ceny na
rynku detalicznym (bj ). W grze tej udział bierze również hipotetyczny gracz H, którego strategie
reprezentują możliwe wyniki procesu negocjacji stawek rozliczeniowych na rynku hurtowym (hl ).
Ruchy poszczególnych graczy reprezentowane są przez procesy ustalania cen na odpowiednich
rynkach:
• A – proces ustalania cen na rynku detalicznym gracza A,
• B – proces ustalania cen na rynku detalicznym gracza B,
• H – proces negocjacji stawek rozliczeniowych pomiędzy graczami A i B (ruch hipotetycznego gracza H). Gra podwójna to – zgodnie z wcześniej wprowadzoną definicją [9, 11] –
sytuacja growa, w której żaden z procesów ustalania cen nie został zakończony.
Procesy te są rozłączne1 .
Analiza gier podwójnych stanowi w istocie łącznik pomiędzy grami dwuosobowymi (w szczególności grą przeciwko naturze i 2-osobową grą pojedynczą o sumie niezerowej) a grami wieloosobowymi, stanowiąc swoisty fundament i zalążek właściwej analizy tych ostatnich. Jest tak w szczególności w przypadkach, gdy pierwszym ruchem w grze podwójnej jest proces ustalania cen na
1
Sytuacje, w których dwa procesy przebiegają jednocześnie uznać można za szczególny przypadek gry poje-
dynczej [9, 11].
x
rynku detalicznym przez danego gracza, np. A. W tej sytuacji, podejmując decyzję wyboru
określonej strategii gry, gracz ten musi się liczyć z tym, że ostateczny wynik gry znany będzie
dopiero po ustaleniu strategii przez dwóch pozostałch graczy: H i B. Znamienne jest to, iż gracz
A ma dość ograniczony wpływ na decyzję gracza H i praktycznie nie ma go w przypadku gracza
B. W tym sensie sytuacja ta jest zbliżona do gry w której udział bierze trzech graczy, co stanowi
najprostszy przypadek gry wieloosobowej.
Rozpatrywane w niniejszej pracy przypadki stanowią też zalążek analizy gier wielokryterialnych. Jest tak pomimo faktu, iż w rzeczywistości gracze biorą udział w grze jednokryterialnej,
rozumianej jako takie w tym sensie, że rozpatrują tylko jedną własną funkcję wypłaty, np. zysk
lub udział w rynku. Element wielokryterialności pojawia się jednakże w kontekście definicji celu,
do jakiego gracze mogą dążyć. Cel ten w szczególności obejmuje nie tylko stosunek do własnej funkcji wypłaty (zasadniczo jego maksymalizację), ale również stosunek do funkcji wypłaty
drugiego gracza. Objawia się to w szczególny sposób wówczas, gdy gracze zmierzają do celów
antagonistycznych próbując z jednej strony maksymalizować wartość własnej funkcji wypłaty,
a z drugiej w jakiejś mierze minimalizować wartość funkcji wypłaty drugiego gracza. Odnaleźć
więc tu można swoistą analogię do przypadku gry, w której gracz kieruje się optymalizacją dwóch
własnych funkcji wypłaty, np. zysku (kryterium maksymalizowane) i ponoszonych kosztów (kryterium minimalizowane), co stanowi najprostszy przypadek gry wielokryterianej.
xi
xii
Rozdział 1
Analiza zależności pomiędzy
ustaloną, a preferowaną kolejnością
ruchów w grze pojedynczej
Rozpatrujemy przypadek, w którym kolejność graczy jest z góry ustalona i niemożliwa do zmiany.
W grze podwójnej będziemy więc mieli sześć sekwencji ruchów graczy: ABH, AHB, BAH,
BHA, HAB, HBA. Ponieważ w wyniku ustalenia ceny na jednym z rynków sytuacja decyzyjna
przekształca się z gry podwójnej w grę pojedynczą [9, 11], pierwszy ruch w grze podwójnej
równoznaczny jest z wyborem gry, w jaką gracze grali będą w grze pojedynczej. Pierwszy ruch
w grze podwójnej umożliwia więc danemu graczowi odpowiednie ukształtowanie struktury gry
pojedynczej. Pierwszy ruch w grze podwójnej traktować zatem należy jako pozycję w tym sensie
uprzywilejowaną.
Z punktu widzenia gracza A uszeregowania BAH i BHA mogą być rozpatrywane jako gra
pojedyncza (AH i HA), bowiem dla niego gra rozpoczyna się dopiero od momentu, gdy gracz
B ustali już swoje ceny na rynku detalicznym (B)1 . W pozostałych przypadkach, a więc AHB,
HAB, ABH i HBA w pierwszym ruchu gracz A ma możliwość określenia (przypadki AHB i
ABH) lub wpłynięcia na określenie (przypadki HAB i HBA) rodzaju gry, jaka będzie rozgrywana
w drugiej fazie – rodzaj gry pojedynczej.
Wcześniejsze analizy [9] doprowadziły nas do sformułowania pojęć: gry z preferencją pierwszego oraz gry z preferencją drugiego. Gra z preferencją pierwszego to gra, w której w sytuacji,
gdy obaj gracze rozgrywają grę o sumie niezerowej (znają nawzajem swoje macierze wypłat),
korzystnie dla obu jest ruszyć się jako pierwszy. Gra z preferencją drugiego zaś, to gra, w której
1
Jest to stwierdzenie prawdziwe przy założeniu, że gracz A nie może bezpośrednio lub pośrednio wpływać na
decyzje cenowe gracza B na rynku detalicznym.
1
2
ROZDZIAŁ 1. ANALIZA ZALEŻNOŚCI POMIĘDZY USTALONĄ, A PREFEROWANĄ KOLEJNOŚCIĄ
RUCHÓW W GRZE POJEDYNCZEJ
w sytuacji, gdy obaj gracze rozgrywają grę o sumie niezerowej, korzystniej dla obu jest ruszyć
się jako drugi.
Wobec powyższego można by przypuszczać, iż dla dla uszeregowań AHB oraz HAB celem
gracza A winien być taki wybór strategii gry w pierwszym ruchu (ai dla przypadku AHB i hl
dla przypadku HAB), który doprowadzi do uzyskania w drugiej fazie gry (gry pojedynczej) gry z
preferencją pierwszego, czyli sytuacji, w której dla obu graczy korzystniej byłoby ruszyć się jako
pierwszemu. Zaś dla uszeregowań ABH oraz HBA celem gracza A winien być taki wybór strategii
gry w pierwszym ruchu (ai dla przypadku ABH i hl dla przypadku HBA), który doprowadzi
do uzyskania w drugiej fazie gry (gry pojedynczej) gry z preferencją drugiego, czyli sytuacji, w
której dla obu graczy korzystniej byłoby ruszyć się jako drugi2 . Jest to jednakże intuicja błędna,
co zostanie wykazane na poniższym przykładzie
Przykład 1.1
Rozważmy przykład, w którym kolejność ruchów graczy jest ustalona w następujący sposób:
HAB. Pierwszym ruchem w grze są więc negocjacje stawek rozliczeniowych (ruch hipotetycznego
gracza H), po którym rozgrywana ma być gra pojedyncza (AB), w której najpier gracz A
ustala swoje ceny na rynku detalicznym (A), a następnie ceny te ustala gracz B (B). Intuicja
podpowiada, że ponieważ w grze pojedynczej (AB) gracz A będzie musiał wykonać ruch jako
pierwszy, w trakcie negocjacji cen na rynku hurtowym (ruch gracza H) powinien dążyć do
wyboru takiej strategii hl , która ukształtuje przyszłą grę pojedynczą, jako grę z preferencją
pierwszego. Rozważmy macierz wypłat graczy jak w tabeli 1.1.
Tabela 1.1: Macierz wypłat graczy A i B w grze podwójnej, w której opłaca się
graczowi A ukształtować grę pojedynczą, jako grę z preferencją drugiego.
h1
h2
b1
b2
a1
[3,3]
[2,4]
a2
[4,2]
[1,1]
b1
b2
a1
[6,5]
[5,6]
a2
[5,6]
[6,5]
Jeśli w trakcie negocjacji zostanie wybrana strategia h1 , wówczas w grze pojedynczej rozgrywana będzie gra z macierzą wypłat jak w tabeli 1.2. Jeśli w trakcie negocjacji zostanie wybrana
2
Przypuszczenie to wynika z faktu wyraźnie i nieodwołalnie ustalonej kolejności ruchów graczy. Nakreślane
tu intuicyjne przypuszczenie sugeruje, że graczowi A winno zależeć na takim ukształtowaniu gry pojedynczej, w
której preferowana kolejność ruchów odpowiadała będzie kolejności ustalonej.
3
strategia h2 , wówczas w grze pojedynczej rozgrywana będzie gra z macierzą wypłat jak w tabeli
1.3.
Tabela 1.2: Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w grze
podwójnej została wybrana strategia h1 .
b1
b2
a1
[3,3]
[2,4]
a2
[4,2]
[1,1]
b1
b2
a1
[6,5]
[5,6]
a2
[5,6]
[6,5]
Gra z macierzą wypłat jak w tabeli 1.2 jest grą z preferencją pierwszego, zaś gra z macierzą 1.3
grą z preferencją drugiego. Widać jednakże, iż nawet przy założeniu, iż w grze pojedynczej gracz
A musi wykonać ruch jako pierwszy, korzystniej dla niego jest rozgrywać grę 1.3. Grając w grę 1.2
gracz A może zapewnić sobie maksymalną wypłatę równą V1A (a2 ) = 4, jeśli wybierze strategię
a2 , a w odpowiedzi gracz B wybierze strategię b1 , maksymalizującą jego wypłatę V2B (bj ), dla
ustalonej strategii gracza A. Grając zaś w grę 1.3 gracz A (przy konieczności wykonania ruchu
jako pierwszy) zapewnić sobie może wypłatę równą conajmniej 5, niezależnie od tego, jaką
wybierze strategię.
Widać więc, iż mimo konieczności wykonywania ruchu jako pierwszy w grze pojedynczej,
graczowi A może opłacać się zabiegać o to, by w trakcie negocjacji wybrana została taka strategia
(hl ), która doprowadzi do sformułowania gry pojedynczej, jako gry z preferencją drugiego.
W analogiczny sposób wykazać można, iż w przypadku, gdy w grze pojedynczej gracz A
musiałby ruszyć się jako drugi (np. sekwencja BA), korzystniej może być dla niego wybrać taką
strategię w grze podwójnej (hl w grze HBA), która doprowadzi do konieczności rozgrywania w
drugiej fazie (gra pojedyncza) gry z preferencją pierwszego.
4
Przykład 1.2
Załużmy, że macierz wypłat przedstawia się jak w tabeli 1.4, a kolejność ruchów określona
jest przez sekwencję HBA.
graczowi A ukształtować grę pojedynczą, jako grę z preferencją pierwszego.
h1
h2
b1
b2
a1
[4,4]
[3,5]
a2
[5,3]
[2,2]
b1
b2
a1
[2,1]
[1,2]
a2
[1,2]
[2,1]
1.6.
b1
b2
a1
[4,4]
[3,5]
a2
[5,3]
[2,2]
b1
b2
a1
[2,1]
[1,2]
a2
[1,2]
[2,1]
Gra z macierzą wypłat jak w tabeli 1.5 jest grą z preferencją pierwszego, zaś gra z macierzą
1.6 grą z preferencją drugiego. Widać jednakże, iż nawet przy założeniu, iż w grze pojedynczej
5
gracz A musi wykonać ruch jako drugi, korzystniej dla niego jest rozgrywać grę 1.5. Grając w
grę 1.6 gracz A może zapewnić sobie maksymalną wypłatę równą 2, niezależnie od tego, jaką
strategię w pierwszym ruchu wybierze gracz B. Grając zaś w grę 1.5 gracz A może sobie zapewnić
wypłatę równą conajmniej 3.
Widać więc, iż mimo konieczności wykonywania ruchu jako drugi w grze pojedynczej, graczowi A może opłacać się zabiegać o to, by w trakcie negocjacji wybrana została taka strategia
(hl ), która doprowadzi do sformułowania gry pojedynczej, jako gry z preferencją pierwszego.
Rzecz jasna zachodzić mogą również przypadki, w których ustalona kolejność ruchów graczy
pokrywać się będzie – z punktu widzenia gracza A – z preferencją ruchów w grze pojedynczej.
Przykład 1.3
Rozważmy przykład, w którym kolejność ruchów graczy jest ustalona w następujący sposób:
HAB. Załużmy, że macierz wypłat graczy przedstawia się jak w tabeli 1.7.
graczowi A ukształtować grę pojedynczą, jako grę z preferencją pierwszego.
h1
h2
b1
b2
a1
[4,4]
[3,5]
a2
[5,3]
[2,2]
b1
b2
a1
[2,1]
[1,2]
a2
[1,2]
[2,1]
1.9.
Gra z macierzą wypłat jak w tabeli 1.8 jest grą z preferencją pierwszego, zaś gra z macierzą
1.9 grą z preferencją drugiego. W tym przypadku opłaca się graczowi A zabiegać, by w trakcie
negocjacji została wybrana strategia h1 co doprowadzi do ukształtowania gry pojedynczej, jako
gry z preferencją pierwszego (tabela 1.8), co jest zgodne z ustaloną kolejnością ruchów (HAB), w
ramach której w grze pojedynczej (AB) gracz A wykonywał będzie ruch jako pierwszy. W przypadku rozgrywania gry z macierzą wypłat jak w tabeli 1.8, gracz A zapewnić sobie może wypłatę
równą conajmniej 3, jeśli wybierze strategię a1 , a przy założeniu, że gracz B w swych decyzjach
6
b1
b2
a1
[4,4]
[3,5]
a2
[5,3]
[2,2]
b1
b2
a1
[2,1]
[1,2]
a2
[1,2]
[2,1]
kierował się będzie wyłącznie maksymalizacją własnej funkcji wypłaty, gracz A zapewnić sobie
może wypłatę równą 5 jeśli wybierze strategię a2 .
W przypadku gry z macierzą wypłat jak w tabeli 1.9 gracz A spodziewać się może wypłaty
równej 1.
Łatwo podać analogiczny przykład, dla przypadku, gdy gracz A w grze pojedynczej musi
wykonać ruch jako drugi. Analogicznej różnorodności przypadków spodziewać się należy również
z punktu widzenia gracza B.
Z powyższych rozważań wynika twierdzenie, iż pomiędzy dwoma celami wyboru strategii
gry w grze podwójnej: ustaleniem preferencji ruchów w grze pojedynczej zgodnej z ustaloną
kolejnością ruchów oraz maksymalizacja (optymalizacja) własnej funkcji wypłat – może, lecz nie
musi zachodzić zbieżność. W szczególnych przypadkach (przykłady 1.1 i 1.2) cele te mogą być
sprzeczne (strategia maksymalizująca wartość funkcji wypłaty może prowadzić do ukształtowania gry pojedynczej, jako gry z preferencją kolejności ruchów niezgodną – z punktu widzenia
danego gracza – z kolejnością ustaloną).
Łatwo wykazać, iż analogiczna zbieżność lub sprzeczność zachodzić może w przypadku gracza
B.
Rozdział 2
Ustalona kolejność ruchów – gracz A
zna sposób rozegrania gry
pojedynczej przez gracza B
Rozważamy przypadek, gdy w grze podwójnej gracz A wykonuje ruch jako pierwszy1 (czy to w
sensie ustalenia cen na rynku detalicznym A, czy w sensie negocjowania cen na rynku hurtowym
H). Wybór określonej strategii gry gracz A uzależnia od celu, jaki chce osiągnąć, jak również od
przewidywanego sposobu rozegrania gry przez gracza B (jego celu). W szczególności cele te mogą
polegać na dążeniu do maksymalizacji (ogólnie optymalizacji) własnej funkcji wypłaty, który
określimy jako cel indywidualnie efektywny i/lub na dążeniu do pogorszenia wartości wypłaty
drugiego gracza (cel antagonistyczny [9]).
Wybór strategii gry w grze podwójnej jest równoznaczny z wyborem gry, jaką gracze rozegrają w drugiej fazie, co określić można jako wybór struktury2 gry pojedynczej. W przypadku
gdy gracz A jest w stanie przewidzieć sposób rozegrania gry pojedynczej przez obu graczy (rozumiany jako cel do jakiego dążą – indywidualnie efektywny lub antagonistyczny), co równoznaczne jest z możliwością przewidzenia wybranych przez nich strategii, a więc i precyzyjnego
określenia wyniku gry, wybór strategii gry w grze podwójnej jest zadaniem prostym: gracz A
powinien wybrać taką strategię w pierwszym ruchu gry podwójnej, która będzie prowadziła do
uformowania takiej gry pojedynczej, której wynik rozegrania będzie z jego punktu widzenia najbardziej korzystny. Sytuacja ulegnie skomplikowaniu wówczas, gdy gracz A nie będzie w stanie
1
Zgodnie z wcześniejszym ustaleniem przypadek, gdy gracz B rusza się jako pierwszy w grze podwójnej
(sekwencje BAH i BHA) traktowany może być z punktu widzenia gracza A jako gra pojedyncza (odpowiednio
AH i HA), bowiem dopiero w grze pojedynczej gracz A może wykonać pierwszy rych.
2
Rozumianej jako macierz wypłat graczy w tej grze.
7
ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY
POJEDYNCZEJ PRZEZ GRACZA B
8
precyzyjnie określić, jaką strategię gry przyjmie w grze pojedynczej gracz B. Oba przypadki
rozpatrzymy osobno.
Przez sposób rozegrania gry pojedynczej rozumiemy cel, do jakiego dążą gracze w trakcie rozgrywania gry. W szczególności cel ten może być celem indywidualnie efektywnym, czyli opartym
o zasadę optymalizacji własnej funkcji wypłaty, bądź też celem antagonistycznym, nastawionym
w jakiejś mierze na pogorszenie wartości wypłaty drugiego gracza. W przypadku, gdy któryś z
graczy dążył będzie do realizaji celu antagonistycznego przyjmiemy, iż znajomość sposobu rozegrania gry oznacza znajomość konkretnej strategii antagonistycznej, jaką będzie się on kierował3 .
W związku z tym, poza przypadkami niejednoznacznych strategii [9], znajomość celu, do jakiego
dąży gracz B pozwala graczowi A w sposób jednoznaczny określić strategię bj , jaką gracz B
wybierze w trakcie rozgrywania gry pojedynczej.
Racjonalny sposób rozegrania gry podwójnej przez gracza A w przypadku, gdy zna on cel
do jakiego dążył będzie gracz B rozważymy w dwóch osobnych przypadkach:
• Pierwszym ruchem w grze podwójnej jest proces negocjacji stawek rozliczeniowych na
rynku hurtowym – H
• Pierwszym ruchem w grze podwójnej jest proces ustalania cen na rynku detalicznym gracza
A
2.1
Pierwszym ruchem w grze podwójnej jest proces negocjacji
stawek rozliczeniowych na rynku hurtowym – H
W przypadku, gdy pierwszym ruchem w grze podwójnej jest proces negocjacji H, w grze pojedynczej będziemy mieli do czynienia z dwoma przypadkami: AB i BA. Przy założeniu, że gracz
A zna sposób rozegrania gry przez gracza B (cel do jakiego będzie on dążył), dla przypadku
AB gracz A może jednoznacznie ustalić, jaką strategię bj w grze pojedynczej wybierze gracz B.
Wynika to z faktu, że decyzja na rynku detalicznym gracza B będzie ostatnim ruchem w grze,
a zatem ustalone już będą strategie hl oraz ai , przez co łatwo będzie przełożyć cel gry gracza
B, na konkretną strategię bj .
Sytuacja będzie jednakże już trudniejsza, jeśli pierwszym ruchem w grze pojedynczej będzie
B. W tej sytuacji jednoznaczne przełożenie celu do jakiego dąży gracz B na konkretną strategię
3
Np. dążenie do uzyskania optymalnej wartości własnej wypłaty przy jednoczesnym możliwie dużym pogorsze-
niu wypłaty drugiego gracza, dążenie do utrzymania wartości własnej wypłaty na określonym poziomie przy
jednoczesnym możliwie dużym pogorszeniu wypłaty drugiego gracza, dążenie do uzyskania maksymalnej różnicy pomiędzy własną wartością wypłaty, a wypłatą drugiego gracza, czy wreszczie dążenie do maksymalnego
pogorszenia wartości wypłaty drugiego gracza (na temat strategii antagonistycznych patrz [9]).
2.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK
ROZLICZENIOWYCH NA RYNKU HURTOWYM – H
9
bj możliwe jest jedynie wówczas, gdy gracz b wie, do jakiego celu dąży gracz A. Jeśli gracz B tego
celu nie zna, jego wybór określonej strategii bj zależny będzie od tego, co myśli o tym, co zrobi
gracz A. W ogólności więc jego wybór określonej strategii bj nie będzie już tak jednoznaczny,
jak w przypadku, w którym proces B miałbyć ostatnim ruchem w grze (przypadek HAB).
Oba przypadki rozpatrzymy osobno.
2.1.1
W grze pojedynczej pierwszy rusza się gracz A (przypadek HAB)
Jeśli pierwszym ruchem w grze podwójnej będzie proces negocjacji H, a pierwszym ruchem w
grze pojedynczej ustalenie przez gracza A cen na rynku detalicznym wówczas gracz A może w
sposób prosty przełożyć cel do jakiego dąży gracz B na konkretną strategię bj . Przy założeniu
znajomości strategii bj , jaką gracz B wybierze w grze pojedynczej, gracz A może w sposób
jednoznaczny określić wynik gry pojedynczej: wartości wypłaty obu graczy, jako wynik wyboru
strategii bj przez gracza B i strategii ai przez gracza A, której znajomość dla A jest oczywista .
W rozważanym przypadku struktura gry pojedynczej, czyli macierze wypłat graczy zależą od
wybranej uprzednio strategii hl w ramach gry podwójnej, zatem wynik gry pojedynczej zależny
jest od wybranej strategii hl . Określona gra pojedyncza jest zatem jedną z L gier, dostąpnych
poprzez wybór określonej strategii hl . Wynik l-tej gry pojedynczej określimy więc jako [VlA , VlB ].
Proces decyzyjny gracza A w grze podwójnej, w przypadku znajomości sposobu rozegrania przez
gracza B gry pojedynczej sprowadza się do wyboru takiej strategii hl (przy założeniu, że proces
H jest pierwszym ruchem w grze), który prowadzi do najkorzystniejszego z punktu widzenia
gracza A wektora wypłat [VlA , VlB ]. Jest to problem dwukryterialny. Gracz A rozegrać go może
w sposób indywidualnie efektywny lub antagonistyczny. W przypadku rozegrania gry w sposób
indywidualnie efektywny gracz A dążył będzie do wybrania takiej strategii ĥl , dla której zachodzi
zależność:
ĥl = arg max VlA .
(2.1)
l
Rozgrywając grę w sposób antagonistyczny gracz A, wybór określonej strategii hl zależny będzie
od siły nastawienia antagonistycznego gracza A. W sytuacji minimalnego antagonizmu gracz A
dążył będzie do wyboru strategii:
n
o
h̆l = arg lex max VlA , −VlB .
l
(2.2)
W sytuacji maksymalnego antagonizmu zaś do wyboru strategii:
n
o
h̆l = arg lex min VlB , −VlA .
l
(2.3)
Przykłady innych (pośrednich) strategii antagonistycznych opisane zostały w pracy [9]. Opisane
podejście zilustrujemy na przykładzie.
10
Przykład 2.1
Rozważmy przykład gry z macierzą wypłat jak w tabeli 2.1. Na rynku detalicznym gracza A
dostępne są trzy strategie: a1 , a2 i a3 . Na rynku detalicznym gracza B również dostępne są trzy
strategie: b1 , b2 i b3 . W ramach negocjacji stawek na rynku hurtowym dostępne są dwie strategie:
h1 oraz h2 . Wymogi prawne, zawarte uprzednio umowy z użytkownikami końcowymi (na rynkach
detalicznych) jak też dotychczasowa umowa interconnectowa wymuszają następującą kolejność
ruchów w grze: HAB. Problem sformułować można w formie pytania: o wybór której ze strategii
hl powinien zabiegać w trakcie negocjacji H gracz A wiedząc, iż gracz B w grze pojedynczej
wybierze strategię minimalnie antagonistyczną postaci 2.3?
Tabela 2.1: Macierz wypłat graczy A i B w grze podwójnej.
h1
h2
b1
b2
b3
b1
b2
b3
a1
[2,1]
[3,3]
[2,3]
a1
[2,1]
[1,2]
[3,2]
a2
[2,2]
[1,3]
[3,1]
a2
[3,2]
[2,1]
[2,2]
a3
[3,2]
[1,2]
[2,1]
a3
[2,1]
[1,2]
[2,2]
Rozwiązywanie problemu rozpoczynamy od analizy każdej z gier pojedynczych. Jeśli w trakcie negocjacji stawek rozliczeniowych (w grze podwójnej) zostanie wybrana strategia h1 , wówczas
macierz wypłat graczy w grze pojedynczej będzie miała postać jak w tabeli 2.2. Jeśli w grze
Tabela 2.2: Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w trakcie
negocjacji wybrana zostanie strategia h1 .
b1
b2
b3
a1
[2,1]
[3,3]
[2,3]
a2
[2,2]
[1,3]
[3,1]
a3
[3,2]
[1,2]
[2,1]
podwójnej wybrana zostanie strategia h2 , wówczas macierz wypłat w grze pojedynczej będzie
miała postać 2.3. Dla uproszczenia grę pojedynczą, odpowiadającą wyborowi w grze podwójnej
strategii h1 określimy jako – h1 , zaś grę odpowiadającą strategii h2 – h2 .
11
Tabela 2.3: Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w trakcie
negocjacji wybrana zostanie strategia h2 .
b1
b2
b3
a1
[2,1]
[1,2]
[3,2]
a2
[3,2]
[2,1]
[2,2]
a3
[2,1]
[1,2]
[2,2]
Wynik każdej z gier pojedynczych zależy nie tylko od strategii gracza B (cen na jego rynku
detalicznym), ale również od strategii gracza A. Załóżmy, iż gracz A kierował się będzie również
strategią minimalnie antagonistyczną, dążąc w pierwszej kolejności do maksymalizacji własnej
funkcji wypłaty, a w przypadku niejednoznaczności, wybierze tę strategię, która da mniejszą
wypłatę graczowi B.
W pierwszej kolejności gracz A określa oczekiwany wynik każdej z gier pojedynczych hl .
• Gra h1
W grze h1 , jeśli gracz A wybierze strategię a1 , gracz B wybierze strategię b3 i ustali się
wynik [2, 3]. Jeśli gracz A wybierze strategię a2 , gracz B wybierze strategię b2 i ustali
się wynik [1, 3]. Jeśli gracz A wybierze strategię a3 , gracz B wybierze strategię b2 i ustali
się wynik [1, 2]. Wobec tego, kierując się strategią minimalnie antagonistyczną w grze h1 ,
gracz A wybrałby strategię a1 co dałoby wynik [2, 3].
• Gra h2
W grze h2 , jeśli gracz A wybierze strategię a1 , gracz B wybierze strategię b2 i ustali się
wynik [1, 2]. Jeśli gracz A wybierze strategię a2 , gracz B wybierze strategię b3 i ustali
się wynik [2, 2]. Jeśli gracz A wybierze strategię a3 , gracz B wybierze strategię b3 i ustali
się wynik [2, 2]. Wobec tego, kierując się strategią minimalnie antagonistyczną w grze h1 ,
gracz A wybrałby strategię a2 , co dałoby wynik [2, 2].
Zakładając znajomość sposobu rozegrania każdej z gier pojedynczych przez gracza B gracz
A może w sposób jednoznaczny określić spodziewany wynik każdej z nich. I tak w grze h1 gracz
A spodziewa się wyniku [V1A , V1B ] = [2, 3], zaś w grze h2 wyniku [V2A , V2B ] = [2, 2]. Wobec tego,
kierując się strategią minimalnie antagonistyczną postaci
n
o
h̆l = arg lex max VlA , −VlB ,
l
(2.4)
gracz A dążył będzie do wybrania w trakcie negocjacji strategii h2 , co w wyniku rozegrania
później gry h2 powinno doprowadzić do wyniku [V2A , V2B ] = [2, 2].
12
W przedstawionym wyżej przykładzie założono, że w obu grach h1 i h2 gracz B dąży do
tego samego celu: maksymalizacji własnej funkcji wypłaty, a w przypadku niejednoznaczności
do minimalizacji wypłaty gracza A (strategia minimalnie antagonistyczna). Rzecz jasna tak być
nie musi. Struktura (macierz wypłat) każdej z gier pojedynczych może zachęcać gracza B, do
kierowania się różnymi kryteriami w każdej grze, bowiem dla każdej z nich współczynnik zachęty
do gry w sposób antagonistycznych
max
=
ΥB
i
ViAmax − ViAmin
ViBmax − ViBmin
,
(2.5)
czy też wyrażony w wartościach względnych
max
=
Υ̃B
i
ViBmax · (ViAmax − ViAmin )
ViAmax · (ViBmax − ViBmin )
,
(2.6)
może przyjmować różną wartość [9]. Może to stanowić element przetargowy w trakcie negocjacji
rozgrywanych w pierwszej fazie gry (w grze podwójnej). Gracz B może grozić graczowi A, iż w
przypadku, gdy negocjacje zakończą się wybraniem określonej strategii hl , w odpowiadającej jej
grze pojedynczej h2 gracz B kierował się będzie strategią wyjątkowo niekorzystną dla gracza A.
Przykład 2.2
Rozważmy przykład gry z macierzą wypłat jak w tabeli 2.4. Załóżmy, iż kolejność ruchów
graczy ustalona została w sposób niezależny od woli graczy, jako sekwencja HAB.
Tabela 2.4: Macierz wypłat graczy A i B, której struktura umożliwia graczowi B
stosowanie gróźb w trakcie negocjacji w grze podwójnej.
h1
h2
b1
b2
a1
[1,4]
[5,5]
a2
[5,5]
[1,4]
b1
b2
a1
[4,6]
[4,5]
a2
[4,6]
[4,5]
Załóżmy ponadto, iż strategia h1 jest strategią rekomendowanych cen przez regulatora rynku,
którą obaj gracze mogą w każdej chwili wybrać czy to na zasadzie wzajemnej decyzji, czy też
na skutek arbitrażu regulatora. W przypadku gdy obaj gracze kierują się w swych decyzjach
maksymalizacją własnej funkcji wypłaty (strategia indywidualnie efektywna), wybór strategii
13
h1 jest dla gracza A korzystny, bowiem spodziewanym wynikiem tej gry jest para: [V1A , V1B ] =
[5, 5]. Z puntku widzenia gracza B byłoby jednak lepiej, gdyby w negocjacjach została wybrana
strategia h2 , to bowiem zapewniłoby, iż wynikiem gry będzie para: [V2A , V2B ] = [4, 6], co jest dla
gracza B rozwiązaniem korzystniejszym. W tej sytuacji gracz B może wysunąć groźbę, iż jeśli
gracz A nie zgodzi się na ustalenie cen na rynku hurtowym na poziomie odpowiadającym strategii
h2 , tylko zerwie negocjacje i odwoła się do arbitrażu regulatora, gracz B w grze h1 dążył będzie do
ustalenia wyniku [V1A , V1B ] = [1, 4]. Należy stwierdzić, iż groźba ta jest dość wiarygodna, bowiem
strata gracza B w rezultacie doprowadzenia do wyniku [V1A , V1B ] = [1, 4] jest znacząco mniejsze
aniżeli strata gracza A. Gracz B ponadto może uczynić swoją groźbę bardziej wiarygodną, jeśli
uda mu się jakimś sposobem zmienić wartość niektórych wypłat w grze h1 . Jeśli w grze h1
macierz wypłat przyjęłaby postać jak w tabeli 2.5, wówczas groźba doprowadzenia do wyniku
[V1A , V1B ] = [1, 4], byłaby o tyle wiarygodna, że gracz B na jej zrealizowaniu nic by nie tracił.
V1B = 4 jest bowiem największą wartością jaką w tej grze gracz B może uzyskać.
Tabela 2.5: Zmodyfikowana macierz wypłat w grze h2 .
b1
b2
a1
[1,4]
[5,4]
a2
[5,4]
[1,4]
Prostą rzeczą byłoby podać przykład sytuacji, w której gracz B może wysuwać groźbę, jeśli
w grze pojedynczej musiałby ruszyć się jako pierwszy.
Struktura macierzy wypłat w grze pojedynczej może także inspirować graczy do składania
obietnic w trakcie rozgrywania gry podwójnej, iż w przypadku wybrania określonej strategii w
trakcie negocjacji, w grze pojedynczej nie będą grali w sposób antagonistyczny, lub też nawet,
że zagrają w sposób altruistyczny, godząc sią na własną stratę z pewną korzyścią dla drugiego
gracza.
Przykład 2.3
Rozważmy przykład gry z macierzą wypłat jak w tabeli 2.6. Załóżmy, iż kolejność ruchów
graczy ustalona została w sposób niezależny od woli graczy, jako sekwencja HAB. Załóżmy
ponadto, iż strategia h1 jest strategią rekomendowaną przez regulatora. Wynikiem maksymalizującym wypłatę obu graczy jest tu wynik [V2A , V2B ] = [5, 5], który ustali się wówczas, gdy w
14
Tabela 2.6: Macierz wypłat graczy A i B, której struktura umożliwia graczowi B
stosowanie gróźb w trakcie negocjacji w grze podwójnej.
h1
h2
b1
b2
a1
[4,4]
[4,4]
a2
[4,4]
[4,4]
b1
b2
a1
[5,1]
[5,1]
a2
[5,5]
[5,5]
ramach gry pojedynczej gracze rozegrają grę h2 i gracz A wybierze strategię a2 . Słusznie jednak
gracz B może się obawiać, iż jeśli w trakcie negocjacji zostanie wybrana strategia h2 , gracz B
zagra w sposób antagonistyczny i – nic na tym nie tracąc – wybierze strategię a1 , co doprowadzi
do najgorszego w całej grze wyniku dla gracza B. W tej sytuacji gracz B może preferować wybór
strategii h1 co da mu pewną wypłatę równą 4.
Jeśli tylko gracz A dąży do maksymalizacji własnej funkcji wypłaty, korzystnym jest dla
niego złożyć w trakcie negocjacji (w grze podwójnej) obietnicę, iż jeśli tylko gracz B zgodzi się na
wybór strategii h2 , on w grze pojedynczej wybierze strategię a2 . Wiarygodność takiej obietnicy
zwiększy się wówczas, gdy gracz A jakimś sposobem zmodyfikuje swoją macierz wypłat tak, by
wybór strategii a1 był i dla niego niekorzystny. Przykładowa modyfikacja macierzy wypłat z gry
h2 podana jest w tabeli 2.7.
Tabela 2.7: Zmodyfikowana macierz wypłat w grze h2 .
b1
b2
a1
[1,1]
[1,1]
a2
[5,5]
[5,5]
Obietnica wyboru strategii a2 w grze h2 byłaby wręcz konieczna wówczas, gdyby macierz
wypłat w grze h2 przedstawiała się jak w tabeli 2.8.
W tej sytuacji gracz B dążył będzie do wyboru w grze podwójnej strategii h1 , słusznie
obawiając się, że w grze h2 gracz A wybierze niekorzystną dla niego strategię a1 . W tej sytuacji
w interesie gracza A jest złożyć obietnicę, iż w przypadku rozgrywania gry h2 wybierze strategię
a2 . Deklaracja wyboru strategii a2 w grze h2 jest w istocie deklaracją rozegrania gry h2 w sposób
altruistyczny, bowiem strategia a2 jest dla gracza A w tej grze gorsza aniżeli strategia a1 . Jest
to jednakże posunięcie korzystne, bowiem prowadzi do wyniku lepszego ([5, 5]), niż w przypadu
15
Tabela 2.8: Macierz wypłat w grze, w której gracz A powinien złożyć obietnicę, iż w
przypadku wybrania strategii h2 , wybierze strategię a2 .
h1
h2
b1
b2
a1
[4,4]
[4,4]
a2
[4,4]
[4,4]
b1
b2
a1
[6,1]
[6,1]
a2
[5,5]
[5,5]
rozgrywania gry h1 ([4, 4]).
Zarówno wysuwanie gróźb jak i składanie obietnic w grze podwójnej, w której toczą się
negocjacje może być posunięciem wiarygodnym, który doczekałby się spełnienia jeśli zaszłyby
określone warunki, jak też zwykłym blefem. Z tym faktem gracze powinni się liczyć. Wiarygodność ta wzrasta wówczas, gdy macierz wypłat gracza wysuwającego groźbę lub składającego
obietnicę zostaje zmodyfikowana w sposób podobny jak w przypadku macierzy 2.5 oraz 2.7, kiedy
to dotrzymanie groźby lub obietnicy przestaje wiązać się ze stratą gracza, który je wysuwa.
2.1.2
W grze pojedynczej pierwszy rusza się gracz B (przypadek HBA)
Przypadek, w którym w grze pojedynczej pierwszy ruch wykona gracz B jest dla gracza A
trudniejszy z punktu widzenia analizy przeprowadzanej w grze podwójnej. Wynika to z faktu,
iż znajomość celu (indywidualnie efektywnego lub antagonistycznego), do jakiego dążył będzie
gracz B nie daje się w każdym przypadku przełożyć w sposób jednoznaczny na wybór konkretnej
strategii bj . Byłoby to możliwe jedynie wówczas, gdy gracz B znałby sposób rozegrania gry
pojedynczej przez gracza A, a więc wiedział, jak na jego strategię bj odpowie gracz A. Z punktu
widzenia rozgrywania gry podwójnej wartym rozważenia przez gracza A jest więc przekazanie
przez niego informacji graczowi B na temat planowanego sposobu rozegrania określonej gry
pojedynczej. Jest z resztą ku temu znakomita sposobność, w trakcie przeprowadzania w grze
podwójnej procesu negocjacji H.
W ten sposób, składając w trakcie negocjacji obietnice i/lub groźby wyboru określonych
strategii ai w odpowiedzi na dane strategie bj , gracz A może nie tylko pozbywać się niepewności,
odnośnie tego, którą strategię w grze pojedynczej wybierze gracz B, ale jednocześnie ułatwiać
sobie wybór określonych strategii hl w grze podwójnej. W tej sytuacji kluczową kwestią staje
się wiarygodność składanych obietnic i gróźb oraz podatność gracza B na to, by w nie uwierzyć.
16
Warto w tym miejscu podkreślić, iż termin obietnica jest w tym miejscu pojęciem bardziej
ogólnym, aniżeli używano go dotychczas. W dotychczasowych rozważaniach terminu obietnica
używaliśmy w kontekście, gdy dany gracz (A) zobowiązywał się do wyboru określonej strategii,
jeśli tylko drugi gracz (B) wybrałby pożądaną przez niego strategię. Owo zobowiązanie kryło w
sobie pewną stratę, którą gracz składający obietnicę zobowiązywał się ponieść. Było to o tyle
sensowne, że gdyby takiej obietnicy nie złożył, drugi gracz (B) wybrał by inną strategię, która
w efekcie dała by graczowi pierwszemu (A) wypłątę jeszcze gorszą.
Użyte natomiast w tym miejscu słowo obietnica oznacza deklarację określonego sposobu
rozegrania gry (być może różnego dla różnych strategii bj ), jednoznacznego poinformowania,
którą ze strategii gracz A wybierze, dla każdej ze strategii bj (i to zarówno w przypadkach
takich strategii bj , w przypadku których składanie obietnic rozumianych jak powyżej nie byłoby
konieczne).
Przykład 2.4
Załóżmy, że macierz wypłat graczy przedstawia się jak w tabeli 2.9. Kolejność ruchów graczy
jest ustalona w sposób następujący HBA. O wybór której ze strategii hl winien zabiegać gracz
A?
Tabela 2.9: Macierz wypłat w grze z ustaloną kolejnością HBA.
h1
h2
a1
a2
b1
[1,3]
[3,4]
b2
[2,2]
[1,1]
a1
a2
b1
[1,5]
[4,4]
b2
[3,1]
[2,2]
Aby odpowiedzieć na to pytanie, należy prześledzić możliwe sposoby rozegrania poszczególnych gier pojedynczych hl . W szczególności, należy odpowiedzieć na pytanie, którą ze strategii
bj w każdej z gier pojedynczyh wybierze gracz B. Załóżmy, że gracz ten dąży do celu indywidualnie efektywnego, a więc zainteresowany jest wyłącznie maksymalizacją własnej funkcji wypłaty.
Załóżmy też, iż takt ten jest znany dla gracza A.
Rozważmy grę hl . Wyboru, której ze strategii bj powinien się tu spodziewać gracz A?
Odpowiedź nie jest prosta i zależna jest od tego, co gracz B myśli na temat sposobu rozegrania
gry przez gracza A. Jeśli założy, iż gracz A dążył będzie do celu indywidualnie efektywnego, lub
minimalnie antagonistycznego, wówczas w interesie gracza B jest wybór strategii b1 , co sprawi,
17
że w odpowiedzi gracz A wybierze strategię a2 , przez co ustali się wynik [3, 4]. Co jednakże się
stanie, jeśli gracz gracz B będzie przypuszczał, że gracz A zagra w sposób bardziej antagonistyczny? Wówczas uzasadnioną jest jego obawa, że w odpowiedzi na strategię b1 zostanie wybrana
strategia a1 , co silniej pogorszy wypłatę gracza B, aniżeli gracza A (wynik [1, 3]). W tej sytuacji gracz B może być skłonny wybrać strategię b2 , ufając, że gracz A wybierze strategię b2 co
doprowadzi do nieefektywnego wyniku [2, 2].
Jakiego sposobu rozegrania gry h2 przez gracza B może się spodziewać gracz A? Jeśli gracz
A nie złoży wiarygodnej obietnicy wyboru strategii a2 w odpowiedzi na strategii b1 , wówczas z
pewnością gracz B wybierze strategię b2 , co doprowadzi do wyniku [2, 2] (jeśli gracz A odpowie
strategią a2 . Wynik ten nie jest efektywny.
Widać zatem, iż w rozważanym przykładzie w interesie gracza A będzie poinformowanie
gracza B o tym, które strategie zamierza wybrać, jako odpowiedź na poszczególne strategie
bj 4 . Warto zwrócić uwagę na fakt, iż charakter obietnicy gracza A w obu grach: h1 i h2 będzie
różny. W grze h1 obietnica wyboru strategii a2 w odpowiedzi na strategię b1 jest w istocie
deklaracją, iż gracz A nie będzie chciał pogorszyć wypłaty gracza B (samemu nic na tym nie
tracąc). Natomiast w grze h2 obietnica wyboru strategii a2 w odpowiedzi na strategię b1 jest
już deklaracją zagrania w sposób, który przyniesie stratę (względem strategii a1 ) graczowi A,
co jednocześnie przyniesie korzyść graczowi B. W pierwszym więc przypadku gracz A deklaruje
rozegranie gry w sposób nie antagonistyczny, w drugim - w kontekście ustalonej strategii b1 - w
sposób silnie altruistyczny.
Jeśli więc przyjąć, iż gracz A dąży do celu indywidualnie efektywnego, to opłaca mu się
poinformować gracza B, iż w obu grach w odpowiedzi na strategię b1 wybierze strategię a2 .
W tym wypadku nie będzie dla niego miało znaczenia, która ze strategii hl zostanie w grze
podwójnej wybrana5 . Jeśli gracz A dążył będzie do celu antagonistycznego wówczas winien
zabiegać o wybór strategii h1 .
Warto jednakże zauważyć, iż zabieganie o wybór strategii h1 jest dla gracza B jasnym komunikatem, iż gracz A dąży do celu antagonistycznego, a więc słusznie można się obawiać, iż
w grze h1 w odpowiedzi na strategię b1 wybierze strategię a1 . W efekcie gracz B może nie być
skłonny wybrać w tej grze strategii b1 . Widać zatem, iż w tym przypadku sama struktura gry
podwójnej niejako utrudnia graczowi A rozgrywanie gry w sposób antagonistyczny. Teoretycznie taki sposób rozegrania gry jest tu możliwy, jednakże zabiegania o taką możliwość osłabia
wiarygodność składanej przez gracza A obietnicy.
4
5
Zagadnienia roli informacji o macierzy wypłat i strategiach graczy omawiane już były w [5, 9].
Z punktu widzenia choćby dłuższej współpracy może się jednak okazać słusznym wybór strategii h2 , co da
lepszy wynik graczowi B, bez straty dla gracza A. Będzie to na dodatek z punktu widzenia całej (podwójnej) gry
- co w realnych warunkach rynkowych oznacza korzyść społeczną - wynik efektywny.
18
Dla odmiany, zabieganie o wybór strategii h2 , w pewnym sensie umacnia wiarygodność gracza
A, a w tym również wiarygodność obietnicy wyboru strategii a2 w odpowiedzi na strategię b1 .
Gracz B może jednakże się słusznie obawiać, że obietnica wyboru strategii a2 jest w istocie
blefem, a deteminacja w dążeniu do wyboru w trakcie negocjacji strategii h2 jest w istocie
wyrazem chęci uzyskania wyniku [1, 5].
Widać więc wyraźnie, iż niezależnie od kierunku starań gracza A w trakcie negocjacji H,
gracz B może być skłonny wybrać strategię b2 . Krytyczną więc się staje kwestia wiarygodności
składanych przez gracza A deklaracji.
W jaki sposób winien rozgrywać grę podwójną gracz A jeśli uznaje, iż gracz B nie do końca
wierzy jego obietnicom (choć ich prawdziwości nie wyklucza), a poprzez to niemożliwym jest
jednoznaczne określenie, którą ze strategii bj gracz B wybierze?
Warto w tym miejscu zauważyć, iż sytuacja, w której gracz A nie wie, jaką strategię w grze
pojedynczej wybierze gracz B jest w sensie modelowym sytuacją analogiczną do tej, gdy w grze
pojedynczej ustalane mają być ceny na rynku detalicznym gracza A oraz stawki rozliczeniowe
na rynku hurtowym H. Wynika to z faktu, iż w tej drugiej sytuacji gracz A również nie wie, na
jaką strategię w trakcie przeprowadzanych w grze pojedynczej negocjacji gracz B się zgodzi. Co
więcej z faktu, że gracz A wie do jakiego celu dąży gracz B sytuację, w której ostatnim ruchem
w grze jest proces A rozpatrywać można tak samo jak sytuację, w której ostatnim ruchem jest
proces B, bowiem wybór określonej strategii ai przy ustalonym celu do jakiego dąży gracz A jest
tak samo zdeterminowany, jak wybór określonej strategii bj , w przypadku, gdy znany dla gracza
A jest cel do jakiego dąży gracz B. W ten sposób dochodzimy do wniosku, iż sytuację BA, w
przypadku, gdy gracz A (mimo znajomości celu gracza B) nie potrafi jednoznacznie wskazać
strategii, którą wybierze gracz B, możemy analizować w sposób identyczny (przy założeniu, że
na rynku hurtowym nie ma strategii rekomendowanych, co łatwo uzyskać wykluczając z analizy
tę strategię), jak sytuację HB, a więc sytuację, w której pierwszym ruchem w grze podwójnej
jest proces ustalania cen na rynku detalicznym gracza A – AHB. Problem ten omawiamy w
następnym punkcie.
2.2
Pierwszym ruchem w grze podwójnej jest proces ustalania
cen na rynku detalicznym gracza A
Jeśli pierwszym ruchem w grze podwójnej będzie wybór przez gracza A jego cen na rynku
detalicznym ai , wówczas określenie a priori wyniku określonej gry pojedynczej (oznaczmy jako
ai ) jest zagadnieniem bardziej złożonym.
2.2. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES USTALANIA CEN NA RYNKU
DETALICZNYM GRACZA A
19
Pierwszym tego powodem jest trudność przewidzenia wyniku procesu negocjacji H, który
odbywał się będzie w trakcie gry pojedynczej ai . Z problemem tym będziemy mieli do czynienia
tak zarówno w przypadku, gdy pierwszym ruchem w grze pojedynczej będzie poces H jak też
proces B. Znajomość celów, do jakich dążyli będą tu gracze nie przekłada się w sposób prosty na
znajomość wyniku, jaki w rezultacie „starcia” tych dążeń się ustali. Gracz A może tu conajwyżej
określić zbiór potencjalnie możliwych wyników danej gry pojedynczej, a następnie podejmując
decyzję w trakcie rozgrywania gry podwójnej, dokonywać w rzeczywistości wyboru pomiędzy
takimi zbiorami. Stosując strategię najbardziej zachowawczą, gracz A może przyjąć, iż wynikiem
negocjacji będzię strategia rekomendowana przez regulatora h∗ (tę strategię obaj gracze zawsze
mogą wybrać [6]). Uzyskany w ten sposób wynik gry pojedynczej gracz A zawsze może traktować jako wynik pewny. Przy takim podejściu problem decyzyjny gracz A w grze podwójnej
traktować moża w sposób identyczny, jak to miało miejsce wówczas, gdy pierwszym ruchem w
grze podwójnej były negocjacje (przypadek omówiony wyżej). Jeśli gracz A dopuszcza możliwość
wyboru innej strategii gry w trakcie negocjacji, wówczas jego problem się komplikuje. W ogólności wybór określonej strategii ai w grze podwójnej wymagać będzie od gracza A porównywania nie
tyle par pojedynczych wypłat obu graczy [VilA , VilB ], odpowiadających jednoznaczym wynikom
A , V B ]].
gier pojedynczych ai ile porównania wektorów par wypłat [[Vi1A , Vi1B ], [Vi2A , Vi2B ], . . . , [ViL
iL
Jest to zatem problem wielokryterialny, a niepewność związana z wynikiem procesu negocjacji
wprowadza niepewność w związku z ostateczym wynikiem gry.
Druga trudność z określeniem wyniku określonej gry ai dotyczy przypadku, w którym pierwszym ruchem w grze pojedynczej będzie ustalenie przez gracza B cen na rynku detalicznym B
(przypadek ABH). Wiąże się to z faktem, iż tym razem i gracz B w trakcie wyboru strategii bj
będzie miał kłopot z określeniem, jaki będzie wynik, następującego potem procesu negocjacji, a
co się z tym wiąże, z punktu widzenia gry podwójnej gracz A, mimo znajomości celu do jakiego
dążył będzie gracz B nie jest w stanie jednoznacznie stwierdzić, jaką strategię bj wybierze w
grze pojedynczej ai gracz B.
2.2.1
Metoda wyboru strategii
Do rozwiązania problemu decyzyjnego w grze podwójnej gracz A zastosować może poniższą
metodę:
Metoda: Wybór strategii gry w grze podwójnej, w której pierwszym ruchem jest
ustalenie cen na rynku detalicznym
1. Określenie dla każdej z gier ai zbioru możliwych wyników negocjacji (wybranych strategii hl
20
oraz odpowiadających im decycji na rynku detalicznym gracza B (bj ) oraz odpowiadających
A , V B ].
im par wypłat [Vijl
ijl
A , V B ], odpowiada2. Stworzenie skalarnej miary oceny (VilA ) poszczególnych wyników gry [Vijl
ijl
jącej celowi, do jakiego dążył będzie gracz A (indywidualnie efektywny lub antagonistyczny)
i przypisanie poszczególnym wynikom ich wartości wyznaczonej przez tą miarę.
3. Określenie pożądanego sposobu agregacji (agregacja względem strategii hl ) poszczególnych
wartości skalarnych Υ(VilA ) i wybór określonej strategii ai dla której agregat przyjmuje
wartość największą.
Powyższa metoda wymaga szczegółowego omówienia.
Omówienie metody: 1. Określenie dla każdej z gier ai zbioru możliwych wyników negocjacji
(wybranych strategii hl oraz odpowiadających im decycji na rynku detalicznym gracza B (bj )
A , V B ].
oraz odpowiadających im par wypłat [Vijl
ijl
Osobnego omówienia wymagają tu dwa możliwe przypadki gier: przypadek AHB i ABH.
Przypadek AHB
W przypadku AHB pierwszym ruchem w grze pojedynczej (HB) są negocjacje stawek rozliczeniowych H. Znając sposób rozegrania gry przez gracza B (cel – inwywidualnie efektywny lub
antagonistyczny – do jakiego będzie dążył), gracz A może dokładnie określić odpowiedź gracza
B (bj ) na wybór określonej strategii hl w negocjacjach. W ten sposób jednoznacznie ustala się
A , V B ].
wynik [Vijl
ijl
W sytuacji, gdy na rynku hurtowym istnieje strategia rekomendowanych cen h∗ gracz A
dokonać może redukcji zbioru możliwych do wybrania w trakcie negocjacji strategii hl , poprzez
odrzucenie tych strategii hl , które w ostateczności doprowadzą do wyniku gorszego dla gracza A
lub gracza B niż by to było w przypadku wyboru strategii h∗ . W ten sposób rozmiar wektorów
[ViA , ViB ] zostaje zredukowany.
Rozważmy to na poniższym przykładzie.
Przykład 2.5
Załóżmy, iż w danej grze pojedynczej macierz wypłat przedstawia się jak w tabeli 2.10. Pierwszym ruchem w grze jest proces negocjacji stawek rozliczeniowych HB. Załóżmy, że ustalając
21
ceny na rynku detalicznym gracz B dążył będzie do maksymalizacji własnej funkcji wypłaty (cel
indywidualnie efektywny). W trakcie negocjacji dostępna dla obu graczy jest strategia rekomendowanych cen h∗ .
Tabela 2.10: Macierz wypłat w grze pojedynczej.
b1
b2
h1 = h∗
[3,2]
[2,3]
h2
[3,1]
[3,2]
h3
[1,3]
[3,1]
h4
[3,7]
[2,2]
h5
[2,2]
[4,4]
Rozważmy, jakie wyniki ustalą się w rezultacie wybrania określonych strategii hl .
• Jeśli w negocjacjach zostanie wybrana strategia h1 wówczas gracz B w odpowiedzi wybierze
strategię b2 . Wynikiem będzie para [2, 3].
Wypłata jaką uzyska gracz B w rezultacie wybrania strategii h2 jest gorsza, aniżeli wypłata,
jaką uzyskałby wybierając strategię rekomendowaną h1 (2 < 3). Analogicznie wypłata jaką
uzyska gracz A w rezultacie wybrania strategii h3 jest gorsza, aniżeli wypłata, jaką uzyskałby
wybierając strategię rekomendowaną h1 (1 < 2). Z tego też względu, analizując tę sytuację z
punktu widzenia gry podwójenj (pierwszy rych w grze AHB) gracz A może przyjąć, iż ani h2
ani h3 nie zostaną w trakcie negocjacji H wybrane.
Warto zauważyć, iż zarówno w przypadku wyboru strategii h4 jak też strategii h5 obaj gracze
uzyskują wyniki lepsze niż w przypadku wybrania strategii cen rekomendowanych. Strategia cen
22
rekomendowanych h∗ nie jest tu więc strategią efektywną i słusznym wobec tego wydawać by
się mogło jej odrzucenie z dalszej analizy. Jednakże z racji na względny rozkład wartości wypłat
dla strategii h∗ , h4 i h5 wydaje się, że byłoby to posunięcie nieroztropne. Wynika to z faktu,
iż każdy z graczy dążył będzie do wyboru innej strategii: gracz A do wyboru strategii h5 , zaś
gracz B do wyboru strategii h4 , a przy tym obaj gracze będą mieli „słuszne” argumenty na
rzecz preferowanej przez siebie opcji. Gracz A wybór strategii h5 popierać może argumentem, iż
uzyskane w ten sposób wynik ([4, 4]) jest bliższy wynikowi odpowiadającemu strategii h∗ ([2, 3])
i że wybór strategii h4 doprowadziłby do nadmiernego faworyzowania gracza B, który miałby
znacząco mocniejszy przyrost wypłaty (7−3 = 4) aniżeli gracz A (3−2 = 1). Gracz B natomiast
argumentować może, że wynik ([4, 4]) doprowadzi do „niesprawiedliwego” zrównania wypłat
graczy, co jest niezgodne z lepszą sytuacją gracza B, określoną wybore strategii rekomendowanej.
Argumenty po obu stronach zdają się być słuszne i w przypadku nieustępliwości po obu stronach
łatwo może dojść do pogorszenia wzajemnych stosunków i zerwania negocjacji, czego wynikiem
będzie „wybór” strategii h∗ .
Z perspektywy rozgrywania gry podwójnej AHB rozsądnym jest więc założenie, iż w rozpatrywanej wyżej grze pojedynczej wybrana może zostać jedna spośród strategii: h1 , h4 lub h5 ,
doprowadając w rezultacie do jednego z trzech wyników: [2, 3], [4, 4] lub [3, 7].
Wprzypadku gdy w grze pojedynczej negocjacje H poprzedzją decyzję na rynku detalicznym
gracza B (przypadek HB) możemy mieć do czynienia z jeszcze jedną trudnością. Trudność ta
związana jest ze stabilonościa celu do jakiego dąży gracz B. Stabilność ta bowiem zależeć może
od sposobu przeprowadzenia procesu negocjacji. Słusznym wydaje się być przypuszczenie, iż
jeśli nawet gracz B pierwotnie zamierzał (co było graczowi A wiadome) dążyć do realizacji celu
indywidualnie efektywnego, to w przypadku agresywnego, nieuczciwego ([1, 2, 16, 18]) lub nadmienie nieustępliwego sposobu negocjawania przez gracza A, gracz B może mieć ochotę zmienić
cel swojej gry na antagonistyczny. I odwrotnie, możliwa (conajmniej teoretycznie) jest sytacja, kiedy to początkowo antagonistyczne nastawienie gracza B zostanie złagodzone na skutek
odpowiedniego sposobu negocjowania przez gracza A.
Rozważmy poniższy przykład.
Przykład 2.6
Rozważmy przykład gry pojedynczej z macierzą wypłat jak w tabeli: 2.11. Załóżmy, że
pierwszym ruchem w grze jest są negocjacje stawek rozliczeniowych. Załóżmy też, iż przystępując
do negocjacji gracz B zakłada rozgrywanie gry w sposób indywidualnie efektywny, co jest dla
gracza A rzeczą wiadomą.
23
Tabela 2.11: Przykład gry, w której decyzja gracza A prowokuje gracza B do zmiany
celu z indywidualnie efektywnego na antagonistyczny.
b1
b2
b3
h1
[1,1]
[2,3]
[5,10]
h2
[4,5]
[2,4]
[0,3]
Zakładając, iż wartości w macierzy wypłat są dla obu graczy porównywalne6 stwierdzić
należy, iż struktura macierzy wypłat wyraźnie faworyzuje gracza B. W przypadku, gdyby obaj
gracze dążyli do celu indywidualnie efektywnego powinien ustalić się wynik [5, 10], odpowiadający wyborowi strategii h1 i b3 . Gracz A może nie być pocieszony tak dużą różnicą wypłat, jaka
przypadnie w efekcie każdemu z graczy i wobec tego może w trakcie negocjacji dążyć do wyboru
strategii h2 , co w przypadku założenia, że jest to strategia rekomendowana przez regulatora
może się okazać celem łatwo osiągalnym. Licząc na indywidualnie efektywny sposób rozegrania gry przez gracza B, gracz A spodziewał się będzie minimalnie gorszego wyniku dla siebie i
znacząco gorszego dla gracza B – [4, 5], odpowiadającego strategiom h2 i b1 . W tym przypadku,
oczywisty, choć w jakimś sensie uzasadniony antagonizm gracza A może okazać się prowokacją
dla gracza B, do zmiany swego pierwotnego nastawienia i odpowiedzenia graczowi A również
w sposób antagonistyczny poprzez wybór strategii b2 , lub nawet b3 , dając w efekcie graczowi A
wypłatę równą co najwyżej 2, lub pozbawiając go wypłaty całkowicie7 .
Zilustrowany w przykładzie 2.6 problem potraktować można albo jako przypadek, w którym
sposób rozegrania gry przez gracza B uzależniony jest od wyniku negocjacji, przy czym sposób
ten jest graczowi A znany (choć nie jest on stały, niezmienny, lecz uzależniony od konkretnej
strategii hl ), albo jako przypadek, w którym gracz A nie zna sposobu rozegrania gry przez
gracza B (celu, do którego dąży gracz B). Ten drugi przypadek omawiany będzie w następnym
rozdziale.
Przypadek ABH
Przypadek ABH, w którym negocjacje są ostatnim ruchem w grze, jest przypadkiem trudniejszym do analizy z punktu widzenia gry podwójnej, w której ruch wykonuje gracz A. Wynika
6
Ta sama wartość liczbowa znaczy tyle samo dla każdego z graczy. W świetle teorii użyteczności jest to
niewątpliwie założenie bardzo silne [?].
7
Przy założeniu, że wypłaty przyjmują wyłącznie wartości nieujemne.
24
to z faktu, iż nie tylko gracz A nie zna potencjalnego wyniku negocjacji H ale również gracz
B tego wyniku nie zna. W związku z tym, mimo znanego graczowi A celu (indywidualnie efektywnego lub antagonistycznego), do jakiego dążył będzie gracz B w grze pojedynczej, gracz A
nie może w sposób jednoznaczny przełożyć tej wiedzy na konkretną strategię bj . Wynika to z
faktu, iż cel, do jakiego dąży gracz B nie zawiera w sobie informacji, na temat jego stosunku do
niepewności [13]. Rozsądnym podejściem jest więc założenie nieznajomości konkretnej decyzji
detalicznej bj gracza B, jak też nieznajomości konkretnego wyniku negocjacji.
Znajomość celu do jakiego dążył będzie gracz B mimo wszystko w wielu przypadkach pozwoli
na częściowe zredukowanie zbioru możliwych wyników gry pojedynczej. Redukacja ta dokonywać
się będzie na dwóch poziomach:
1. Dla każdej strategii bj wybór tylko takich strategii hl , które w rezultacie dadzą wynik
niegorszy (dla obu graczy) niż strategia rekomendowana h∗ .
2. Odrzucanie tych strategii bj , które w sensie celu, do jakiego dąży gracz B są zdominowane
przez inne strategie cen na rynku detalicznym gracza B.
Realizacja punktu pierwszego jest zadaniem prostym i już omówionym w trakcie rozważania
przypadku AHB. Realizacja punktu drugiego jest o wiele trudniejsza. Poza przypadkami, gdy
dla danej strategii bj 0 wszystkie wypłaty gracza B są gorsze (a przy tym wszystkie wypłaty
gracza A są lepsze) niż w przypadku wybrania innej strategii bj 00 , (dla każdej strategii hl ),
co umożliwiałoby usunięcie z rozważań strategii bj 0 jako zdominowanej (niezależnie od celu –
poza radykalnie altruistycznym – do jakiego dążył będzie gracz B) porównanie dwóch strategii bj
wymaga w istocie zbudowania skalarnej miary oceny wyników otrzymanych przez obu graczy dla
poszczególnych strategii hl . Dodaktowo jeszcze, z racji na niewiedzę, która ze strategii hl zostanie
w trakcie negocjacji wybrana, porównanie dwóch strategii bj wymagałoby ponadto znajomości
sposobu agregacji względem strategii hl wartości skalarnych odpowiadających poszczególnym
wynikom gry, jaki gracz B przyjmie, co z punktu widzenia gracz A może się okazać niemożliwe.
Tworzenie skalarnej miary oceny wyniku gry, jak też sposoby agregacji wartości skalarnych
zostaną omówione w dwóch następnych punktach omówienia prezentowanej metody.
Warto jeszcze zwrócić uwagę, iż sposób rozgrywania gry pojedynczej, czyli cel do jakiego
dążył będzie gracz B w trakcie ustalania cen na rynku detalinczym B, może mieć wpływ na
przebieg procesu negocjacji. Nie jest to już jednakże problem, nad którym kontrolę sprawować
może gracz A. Jego udział w grze pojedynczej rozpoczyna się bowiem dopiero wówczas, gdy
zaczną się negocjacje H, a to z jakim nastawieniem obu graczy się zaczną zależy już wyłącznie
od detalicznej decyzji gracza B. Rzecz jasna gracz A ma w jakiejś mierze wpływ tak zarówno na
detaliczną decyzję gracza B, jak też na jego nastawienie w trakcie procesu negocjacji H. Wpływ
25
ten jednakże dokonuje się „z poziomu” gry podwójnej, nie zaś pojedynczej. Przy uszeregowaniu
ABH decyzja na rynku detalicznym gracza A może dać graczowi B pewne informacje odnośnie
tego, z jakim nastawieniem gracz A może przystąpić do negocjacji. Decyzja ta jednak może
być również swoistym zaproszeniem „odpłacenia pięknym za nadobne”, w przypadku gdyby z
punktu widzenia gracza B decyzja na rynku detalicznym ai gracza A została odebrana jako
posunięcie antagonistyczne.
Określając dostępne w ramach negocjacji strategie hl gracze muszą się również odnosić do
kwestii siły negocjacyjnej graczy. Im siła ta będzie większa, tym uznać można, że większa cześć
strategii hl – jednakże tylko takich, których wartość dla obu graczy jest niemniejsza niż wartość
strategii h∗ – dostępna będzie dla gracza, który tę siłę posiada. Do określenia zbioru tych strategii
zastosować można metody właściwe dla gier pojedynczych [9].
Omówienie metody: 2. Stworzenie skalarnej miary oceny (VilA ) poszczególnych wyników gry
A , V B ], odpowiadającej celowi, do jakiego dążył będzie gracz A (indywidualnie efektywny lub
[Vijl
ijl
antagonistyczny) i przypisanie poszczególnym wynikom ich wartości wyznaczonej przez tą
miarę.
Istotą tego punktu metody jest stworzenie narzędzia umożliwiającego skalarną ocenę dwuwartościowego wyniku gry [V A , V B ]. Innymi słowy szukamy funkcji odzworowującej punkty z dwuwymiarowej (wypłata gracza A i wypłata gracza B) przestrzeni wyników w wartości skalarne, których
wartość odzwierciedlała będzie cel (indywidualnie efektywny lub antagonistyczny) do jakiego
dążył będzie gracz, z puntku widzenia którego taka ocena wyniku jest realizowana8 .
Poniżej podamy w sposób przykładowy możliwe do zastosowania miary oceny, dla omawianych we wcześniejszym opracowaniu [9] sposobów rozgrywania gry przez gracza A.
• Cel indywidualnie efektywny
W tym podejściu gracz A dąży wyłącznie do maksymalizacji własnej funkcji wypłaty
ignorując wypłatę gracza B. Ten sposó rozegrania gry zapisać można jako następujące
zadanie optymalizacji:
n
o
ak = arg max V A (ai ) .
i
(2.7)
Przy tak sformułowanym celu, gracz A ocenia dany wynik tym lepiej, im większą wartość
przyjmuje jego wypłata. Stąd miarą oceny danego wyniku [V A , V B ] może być następująca
8
Omawiając metodę jesteśmy zainteresowani oceną z punktu widzenia gracza A. Gracz A jednakże może
być również zainteresowany znajomością wartości oceny wyniku z punktu widzenia gracza B (patrze omówiony
wcześniej przypadek ABH).
26
funkcja:
V A [V A , V B ] = V A .
(2.8)
• Cel minimalnie antagonistyczny
W tym podejściu gracz A dąży do maksymalizacji własnej funkcji wypłaty, a w przypadku
niejednoznaczności wybiera tę strategię, która da najmniejszą wypłatę graczowi B. Ten
sposó rozegrania gry zapisać można jako następujące zadanie optymalizacji:
n
o
ak = arg lex max V A (ai ), −V B (ai ) .
i
(2.9)
Przy tak sformułowanym celu gracza A, miara oceny danego wyniku [V A , V B ] może być
sformułowana w sposób następujący:
V A [V A , V B ] = wA · V A − wB · V B ,
(2.10)
przy czym wA przyjmuje dużo większą wartość niż wB (wA wB ).
• Cel maksymalnie antagonistyczny
W tym podejściu gracz A dąży w pierszej kolejności do minimalizacji wartości wypłaty
gracza B – V B , a w przypadku niejednoznaczności wybiera tę strategię, która da największą wypłatę V A . Ten sposó rozegrania gry zapisać można jako następujące zadanie
optymalizacji:
n
o
ak = arg lex min V B (ai ), −V A (ai ) .
i
(2.11)
V A [V A , V B ] = wA · V A − wB · V B ,
(2.12)
przy czym wA przyjmuje dużo mniejszą wartość niż wB (wA wB ).
• Dążenie do uzyskania maksymalnej odległości pomiędzy wypłatami graczy
Ten sposó rozegrania gry zapisać można jako następujące zadanie optymalizacji:
n
o
ak = arg max V A (ai ) − V B (ai ) .
i
(2.13)
V A [V A , V B ] = V A − V B .
(2.14)
27
• Dążenie do osiągniecia odpowiedniej różnicy wypłat graczy – δ, a po jej uzyskaniu do maksymalizacji własnej funkcji wypłaty
Ten sposób rozegrania gry sformułować to można w postaci następującego zadania optymalizacji leksykograficznej:
n
o
ak = arg lex max ∆i , V A (ai ) ,
(2.15)
i
gdzie:
n
o
∆i = min δ, V A (ai ) − V B (ai ) .
V A [V A , V B ] = w∆ · ∆ + wA · V A ,
(2.17)
przy czym w∆ wA .
• Dążenie do maksymalizacji własnej funkcji wypłaty przy jednoczesnym dążeniu, by wartość
wypłat gracza B nie przekroczyła pewnej wartości progowej ν
Ten sposób rozegrania gry sformułować to można w postaci następującego zadania optymalizacji:
n
o
ak = arg max V A (ai ) ,
(2.18)
i
przy ograniczeniu:
V B (ai ) ¬ ν.
n
V A [V A , V B ] = wA · V A − wν · max ν, V B
o
(2.19)
przy czym wA wν .
• Dążenie do minimalizacji wartości wypłaty gracza B przy jednoczesnym dążeniu, by własna (V A ) wartość wypłaty nie przekroczyła pewnej wartości progowej ν
Ten sposób rozegrania gry sformułować to można w postaci następującego zadania optymalizacji:
n
o
ak = arg min V B (ai ) ,
i
przy ograniczeniu:
V A (ai ) ν.
(2.20)
28
o
n
V A [V A , V B ] = wν · min ν, V A − wB · V B ,
(2.21)
przy czym wν wB .
• Strategia antagonistyczna wyrażona za pomocą pojęć metody punktu odniesienia
Przy tym podejściu gracz A dąży do maksymalizacji własnej funkcji wypłaty, a jednocześnie minimalizacji wartości wypłaty gracza B, maksymalizując wartość odpowiedniej
funkcji skalaryzującej, której parametrami sterującymi są punktu rezerwacji i aspiracji dla
funkcji wypłaty zarówno gracza A jak i gracza B.
Cząstkowa funkcja osiągnięcia dla (maksymalizowanej) funkcji wypłaty gracza A wyrażona
będzie zależnością:
ηA V A (ai ) =







β(V A (ai )−V A )
dla V A (ai ) < V A
A
V −V A
V A (ai )−V A
dla V A ¬ V A (ai ) ¬ V
A
V





 1+
−V A
A
α(V A (ai )−V )
dla V
A
V −V A
Przy czym V A oznacza punkt rezerwacji, a V
A
A
A
(2.22)
< V A (ai )
punkt aspiracji dla funkcji wypłaty V A (ai )
gracza A. Cząstkowa funkcja osiągnięcia dla (minimalizowanej) funkcji wypłaty gracza B
wyrazi się zależnością:
ηB V B (ai ) =



1+



 B
V
α(V B (ai )−V
B
V −V
(ai )−V B
B
)
dla V B (ai ) < V
B
dla V
B






V −V B
β(V B (ai )−V B )
V
B
B
B
¬ V B (ai ) ¬ V B
(2.23)
dla V B < V B (ai )
−V B
Strategia antagonistyczna przybierze wówczas postać:
(
ak = arg max
i
A
B
min ηA V (ai ) , ηB V (ai )
A
B
+ ρ · ηA V (ai ) + ηB V (ai )
)
.
(2.24)
Przy tak sformułowanym celu gracza A, skalarna miara oceny danego wyniku [V A , V B ]
może być sformułowana w sposób następujący:
V
A
A
B
A
B
[V , V ] = min ηA V (ai ) , ηB V (ai )
A
B
+ ρ · ηA V (ai ) + ηB V (ai )
.
(2.25)
29
Omówienie metody: 3. Określenie pożądanego sposobu agregacji (agregacja względem
strategii hl ) poszczególnych wartości skalarnych Υ(VilA ) i wybór określonej strategii ai dla której
agregat przyjmuje wartość najlepszą.
W wyniku skalaryzacji wyników gry (punkt 2 omawianej metody) dla poszczególnych strategii hl otrzymujemy z wektora par wypłat (z wektora wyników gry odpowiadających poszczególnym strategiom hl ) wektor wartości skalarnych, odpowiadających celowi, do jakiego dąży gracz
A9 – [V1A , V2A , . . . , VLA ]. Każdej, potencjalnie możliwej do wyboru (w trakcie rozgrywania gry
A , V A , . . . , V A ], a zatem by ocenić daną
podwójnej) strategii ai odpowiada wektor takich ocen [Vi1
i2
iL
strategię (a co się z tym wiąże odpowiadającą jej grę pojedynczą) należy te wektory z sobą
porównać. Porównanie to wymaga stworzenia zaagregowanej (skalarnej) miary, odzwierciedlającej stosunek gracza A do niepewności, związanej z możliwymi wynikami procesu negocjacji
(H). W istocie problem decyzyjny gracza A przedstawić można w formie swoistej gry przeciwko
naturze, w której strategiami gracza A są jego strategie cen detalicznych ai , a strategiami natury
możliwe wyniki negocjacji hl (z uwzględnieniem redukcji liczby strategii hl przeprowadzonej w
pierwszym punkcie omawianej metody). Wypłatami gracza A są tu skalarne wartości oceny VilA
poszczególnych wyników [VilA , VilB ]. Ilustruje to w sposób przykładowy macierz wypłat z tabeli
2.12.
Tabela 2.12: Ilustracja gry podwójnej, w której pierwszym ruchem jest ustalenie
przez gracza A cen na rynku detalicznym, jako modelu gry przeciwko naturze, której
strategiami są możliwe do przyjęcia przez obu graczy wyniki procesu negocjacji hl .
h1
h2
h3
..
.
h4
···
···
A
V23
..
.
..
.
···
a1
a2
a3
a4
Przy takim sformułowaniu, do rozwiązania problemu decyzyjnego gracza A w grze podwójnej,
w której pierwszym ruchem jest ustalanie cen na rynku detalicznym przez gracza A zastosować
można określone kryteria wyboru strategii w grze przeciwko naturze [3, 6, 7, 9, 10, 13, ?, 22].
W sposób przykładowy wymienimy tu kilka z nich.
9
Ewentualnie gracz B, jak to było sygnalizowane w przypadku ABH.
30
1. Kryterium Walda
Υi (VilA ) = min VilA
l
ak = arg max Υi (VilA ).
i
(2.26)
2. Kryterium optymistyczne
Υi (VilA ) = max VilA
l
i
(2.27)
3. Kryterium Laplace’a
1X A
V .
L l il
Υi (VilA ) =
i
(2.28)
A , V A , . . . , V A ] dla różnych wartości i, a więc dla różnych
Należy zwrócić uwagę, iż wektory [Vi1
i2
iL
gier pojedynczych mogą mieć różne wymiary, z racji na początkową redukcję liczności zbioru
potencjalnie możliwch do wyboru strategii hl . Z tego też względu do wyboru strategii ai nie
należy stosować kryteriów, które wrażliwe są na liczbę rozpatrywanych strategii (np. kryterium
sumy wypłat, jako uproszczona wersja wartości średniej użytej w kryterium Laplace’a).
2.2.2
Przykład zastosowania metody
Użyteczność zaproponowanej metody omówimy na poniższym przykładzie.
Przykład 2.7
Niezależny operator lokalny A od dłuższego czasu korzysta z oferowanej przez operatora
zasiedziałego B usługi WLR10 do świadczenia usługi dostępu dla swoich użytkowników końcowych, fizycznie podłączonych do sieci operatora zasiedziałego oraz usług połączeniowych na
zasadzie preselekcji. Mając w perspektywie rozbudowę własnej sieci do poziomu przełącznicy
głównej MDF11 i co się z tym wiąże rezygnację z WLR na rzecz LLU12 , co zapewni mu większą
kontrolę nad jakością oferowanych usług, operator A zamierza rozpocząć intensywną kampanię
10
11
12
Wholesale Line Rental.
Message Distribution Frame.
Local Loop Unbundling.
31
reklamową, promującą nowy pakiet usług, w celu pozyskania nowych abonentów (dotychczas korzystających z usług operatora B). Operator A spodziewa się, że kampania ta wywoła odzew ze
strony operatora zasiedziałego i to jeszcze zanim zdążą sfinalizować zasady korzystania z usługi
LLU.
Operator A zakłada możliwość promowania jednego z trzech wariantów oferty detalicznej: a1 ,
a2 lub a3 . Spodziewa się, iż w odpowiedzi operator B wdrożyć może jeden z trzech planów taryfowych: b1 , b2 lub b3 . Na bazie oceny własnej infrastruktury sieciowej oraz możliwych punktów
styku (kolokacji) z siecią operatora B, operator A dopuszcza dwa sposoby korzystania z uwolnionej pętli lokalnej (ULL) operatora A: h2 i h3 . Z racji na fakt, iż operator B zobowiązany jest
przedstawienia oferty ramowej w sprawie LLU, co jak pokazała dotychczasowa praktyka staje
się podstawą do stworzenia rekomendowanych przez regulatora zasad wzajemnej współpracy w
przypadku braku porozumiemia, operator A uwzględnia też możliwość, iż wynikiem (zerwanych)
negocjacji będzie przyjęcie zasad określonych w tej ofercie: h1 .
Na podstawie opracowanego przez Państwowy Instytut Badawczy powszechnie dostępnego
modelu popytu na usługi telekomunikacyjne obaj operatorzy określili szacunkową liczbę pozyskanych (utraconych) abonentów w rezultacie wdrożenia poszczególnych ofert detalicznych
(swojej i konkurenta), a następnie oszacowali wielkość rocznych przychodów czerpanych z oferowanych im usług. Wartości przychodów (w milionach złotych) dla poszczególnych wariantów
ofert detalicznych oraz wariantów porozumienia w sprawie LLU zilustrowano w tabeli 2.13.
Presja ze strony rosnącej konkurencji sprawia, iż obaj gracze dążą do osiągnięcia jak najlepszych wyników finansowych ze swego punktu widzenia, a przy tym w miarę możliwości do
pogorszenia wyników konkurentów (cel minimalnie antagonistyczny).
Problem sprowadza się do pytania: który z wariantów oferty detalicznej gracz A powinien
wybrać?
Tabela 2.13: Gra podwójna na rynku lokalnym.
a1
a2
h1
h2
h3
b1
[2, 3]
[3, 1]
[1, 4]
b2
[2, 2]
[5, 3]
b3
[3, 2]
[3, 4]
a3
h1
h2
h3
h1
h2
h3
b1
[1, 2]
[2, 3]
[3, 2]
b1
[2, 5]
[3, 4]
[4, 3]
[3, 5]
b2
[5, 2]
[4, 3]
[4, 4]
b2
[1, 1]
[2, 5]
[2, 5]
[4, 2]
b3
[2, 3]
[3, 2]
[2, 3]
b3
[3, 3]
[3, 2]
[2, 3]
Opisany wyżej problem to w istocie przykład gry podwójnej, w którym ustalona została
kolejność ruchów w kolejności ABH. Ponadto obaj gracze znają nawzajem swój sposób roze-
32
grania gry (cel minimalnie antagonistyczny). Znają też nawzajem swoje macierze wypłat. Do
rozwiązania tego problemu zastosujemy omówioną uprzednio metodę.
1. Określenie dla każdej z gier ai zbioru możliwych wyników negocjacji (wybranych strategii hl
oraz odpowiadających im decycji na rynku detalicznym gracza B (bj ) oraz odpowiadających im
A , V B ].
par wypłat [Vijl
ijl
W pierszej kolejności próbujemy ustalić, jakie są potencjalnie możliwe wyniki każdej z gier
pojedynczych ai . Przedyskutujmy zatem poszczególne gry w celu odrzucenia tych strategii, które
nie powinny zostać wybrane.
Analiza gry a1
Macierz wypłat w grze pojedynczej a1 przedstawia się jak w tabeli 2.14. Rozważmy możliwe
sposoby rozegrania tej gry.
Tabela 2.14: Macierz wypłat z gry pojedynczej a1 .
h1
h2
h3
b1
[2, 3]
[3, 1]
[1, 4]
b2
[2, 2]
[5, 3]
[3, 5]
b3
[3, 2]
[3, 4]
[4, 2]
W sytuacji gdy gracz B wybrałby strategię b1 , wówczas teoretycznie możliwe sa trzy wyniki:
[2, 3], [3, 1] i [1, 4]. W praktyce jednak, z racji na fakt, iż strategia h1 jest strategią rekomendowaną
przez regulatora, on w rzeczywistości byłaby wynikiem negocjacji. Na wybór strategii h2 nie
zgodzi się gracz B, bowiem wówczas otrzymał by wypłatę (1) mniejszą, aniżeli w przypadku
strategii rekomendowanej (3). Z tych samych względów na wybór strategii h3 nie zgodziłby się
gracz A. W przypadku wyboru strategii b1 możliwy jest więc jedynie wynik [2, 3] odpowiadający
wyborowi na rynku hurtowym strategii h1 .
Ciekawa sytuacja zachodzi w przypadku, gdyby gracz B wybrał strategię b2 . Wynik [2, 2]
odpowiadający strategii rekomendowanej h1 jest wynikiem gorszym dla obu graczy aniżeli wyniki
odpowiadające strategiom h2 i h3 . W tym przypadku jednak obaj gracze dążyli będą w negocjacjach do wyboru innej strategii. Gracz A dążył będzie do wyboru strategii h2 , co da [5, 3], gracz
B natomiast do wyboru strategii h3 , co da wynik [3, 5]. Sytuacja wydaje się trudna i nieposiadająca efektywnego rozwiązania kompromisowego. Nie można więc wykluczyć, iż gracze nie zawrą
33
porozumienia i negocjacje zostaną zerwane, co w efekcie da im wynik nieefektyny [2, 2]. W tej
sytuacji należy się liczyć, iż wynikiem negocjacji może być każda ze strategii hl .
W sytuacji wyboru przez gracza B strategii b3 , wynik odpowiadający rekomendowanej przez
regulatora strategii h1 również nie jest rozwiązaniem efektywnym. Jednakże na wyborze innej
strategii skorzystać może tylko jeden z graczy. Wybór strategii h2 przynosi korzyść jedynie graczowi B, wybór strategii h3 – jedynie graczowi A. W tej sytuacji, z racji na fakt, iż gracze kierują
się celem minimalnie antagonistycznym, dążąc w pierwszej kolejności do wyboru strategii najkorzytniejszej dla siebie, a w przypadku niejednoznaczności wyniku, to wyboru strategii dającej
gorszą wypłatę drugiemu graczowi, jedynym akceptowalnym przez obie strony rozwiązaniem jest
wybór strategii h1 , co da wynik [3, 2].
Z punktu widzenia problemu decyzyjnego gracza A w grze podwójnej, istotna jest odpowiedź
na pytanie: którą ze strategii bj wybierze gracz B. Wymaga to porównania z punktu widzenia
celu gracza B wyników, jakie mogą się ustalić w rezultacie wyboru poszczególnych strategii bj .
Jeśli gracz B wybrałby strategię b1 ustali się wynik [2, 3]. Jeśli gracz B wybierze strategię
b2 ustali się jeden z wyników: [2, 2], [5, 3] lub [3, 5]. Jeśli gracz B wybierze strategię b3 ustali
się wynik [3, 2]. Z powyższego zestawienia pewnym jest, iż gracz B nie wybierze strategii b3 ,
bowiem to dałoby mu wypłatę gorszą (równą 2), niż w przypadku wyboru strategii b1 (równą
3). Można również założyć, iż motywacją wyboru strategii b2 nie będzie z pewnością nadzieja
uzyskania wyniku [5, 3], bowiem minimalnie antagonistyczne nastawienie gracza B sugerowałoby
mu raczej wybór strategii b1 , co bez straty dla niego da gorszą wypłatę graczowi A. Wybór
strategii b2 motywowany może więc być jedynie nadzieją na osiągnięcie wyniku [3, 5]. W trakcie
rozgrywania gry pojedynczej, gracz B może wykorzystać tę sytuację, stawiając warunek graczowi
A, iż wybierze strategię b2 tylko pod warunkiem, że gracz A zgodzi się na wybór strategii h3 .
Z punktu widzenia dopiero co zakończonej (wyborem strategii a1 ) gry podwójnej, gracz A sam
może taką propozycję złożyć, iż zgodzi się na wybór strategii h3 jeśli tylko gracz B wybierze
strategię b2 . Jeśli taka propozycja zostanie złożona, to gracz A może przyjąć, iż gracz B wybierze
w grze a1 strategię b2 . Jaki będzie wówczas wynik? Jeśli przyjęta propozycja będzie wiarygodna,
wynikiem będzie [3, 5]. Jednakże gdy już dojdzie do negocjacji warunków umowy hurtowej H,
czyli już po wyborze strategii a1 i b2 na swój sposób „gra” zacząć się może od nowa. Stawiając na
szali własną reputację, jako wiarygodnego gracza, A może zacząć zabiegać o uzyskanie wyniku
[5, 3]. Wybór strategii b2 zależny jest więc od tego, na ile gracz B postrzega gracza A, jako
wiarygodnego. Przed potencjalnym niedotrzymaniem słowa przez gracza A, gracz B może się
zabezpieczyć czyniąc proces ustalania cen detalicznych bj elementem procesu negocjacji H, czyli
w istocie przekształcając przypadek ABH, w przypadek A(BH) [9].
34
Możliwym jest jednakże również wybór strategii b2 mimo braku złożonych uprzednio deklaracji
przez gracza A, jak również braku postawionych przez gracza B wstępnych warunków. Gracz B
może po prostu ryzykować wybór strategii b2 w nadzieji, że uda mu się wynegocjować zasady
określone przez h3 (co jest zgodne z minimalnie antagonistycznym celem do jakiego dąży), a w
najgorszym razie może się zgodzić na strategię h2 , która co prawda względem strategii b1 nie
będzie zbyt dobrze odzwierciedlać celu (minimalnie) antagonistycznego, ale przynajmniej nie
przyniesie mu straty.
Wobec powyższych rozważań gracz A nie może mieć pewności, który z wyników w ostateczności się ustali. Rozsądnym jest więc założenie, iż gra a1 zakończyć się może jednym z czterech
wyników: [2, 3], [2, 2], [5, 3] lub [3, 5].
Analiza gry a2
h1
h2
h3
b1
[1, 2]
[2, 3]
[3, 2]
b2
[5, 2]
[4, 3]
[4, 4]
b3
[2, 3]
[3, 2]
[2, 3]
W sytuacji, gdy gracz B wybierze strategię b1 , w ramach negocjacji H gracz A dążył będzie
do wyboru strategii h3 , natomiast gracz B do wyboru strategii h2 . Warto zauważyć, iż strategia rekomendowana przez regulatora h1 jest w sensie celu (minimalnie antagonistycznego) do
jakiego dążą gracze strategią zdominowaną jedynie przez strategię h2 , kiedy to obaj gracze
uzyskują rozwiązanie lepsze [2, 3]. Strategia h3 dominuje strategię h1 jedynie z punktu widzenia
gracza A, uzyskuje on bowiem poprawę swego wyniku, bez pogorszenia wypłaty gracza B. Z
punktu widzenia gracza B zachodzi jednak już dominacja odwrotna. Gracz B bowiem oprócz
maksymalizacji własnej wypłaty zainteresowany jest również minimalizacją wypłaty gracza A,
a więc wynik [1, 2] jest dla niego bardziej pożądany. Oczywistym jest więc, iż strategia h3 nigdy
nie zostanie wybrana – nie zgodzi się na to gracz B.
Ciekawą kwestią jest tutaj sposób argumentowania, jaki w trakcie negocjacji H gracz B
mógłby wysuwać. Wcale nie musiałby otwarcie mówić, że dąży do pogorszenia wypłaty gracza
35
A. Wystarczyłoby, że odwołałby się do wyniku [2, 3] zarzucając niezgadzającemu się na jego
przyjęcie graczowi A brak dobrej woli (w istocie, traktując wynik [1, 2] jako swoiste status qou,
wynik [2, 3] – jako równomiernie poprawiający sytuację obu graczy – jawi się jako rozwiązanie
bardziej uczciwe). Słusznie więc można się spodziewać, iż jeśli tylko gracze utrzymają swe minimalnie antagonistyczne nastawienie rezultatem gry będzie [2, 3].
W sytuacji wyboru strategii b2 oczywistym wynikiem negocjacji będzie [5, 2], odpowiadający
wyborowi przez gracza A strategii h1 , rekomendowanej przez regulatora. Podobnie w przypadku
wyboru strategii b3 wynikiem będzie [2, 3], który ustali się albo w rezultacie wyboru strategii h1
albo h3 .
Na podstawie powyższych analiz można się spodziewać, iż gracz B wybierze strategię b3 ,
co doprowadzi do wyniku [2, 3]. Jest to rozwiązanie nieefektywne. Lepsze wyniki obaj gracze
uzyskali by wówczas, gdyby gracz B wybrał strategię b2 , a wynikiem negocjacji byłaby strategia
h3 . Gracz B jednakże słusznie się obawia, iż w przypadku, gdyby wybrał strategię b2 gracz A
zerwie negocjacje i w rezultacie ustali się wynik [5, 2] określony przez strategię h1 . Widać zatem,
iż korzystnym byłoby tu dla obu graczy, gdyby gracz A złożył obietnicę, iż w przypadku, gdy
gracz B wybierze strategię b2 , zgodzi się na wybór strategii h3 .
A zatem wynik gry a2 zależny jest od postawy gracza A, oraz postrzeganej przez gracza B
wiarygodności jego obietnicy. Jeśli gracz A złoży wiarygodną obietnicę wyboru strategii h3 (np.
obniżając wartość własnej wypłaty dla strategii h1 z 5 do 3), może się spodziewać wyniku [4, 4].
Jeśli takiej obietnicy nie złoży, lub gracz B w nią nie uwierzy wynikiem będzie [2, 3].
Analiza gry a3
h1
h2
h3
b1
[5, 2]
[3, 4]
[4, 4]
b2
[1, 1]
[2, 5]
[2, 5]
b3
[3, 3]
[3, 2]
[2, 3]
W sytuacji, gdy gracz B wybierze strategię b1 , wynikiem negocjacji będzie strategia rekomendowana [h1 ] (co jest w interesie gracza A), w rezultacie czego ustali się wynik [5, 2].
36
W sytuacji wyboru strategii b2 , minimalnie antagonistyczne podejście gracza A będzie przyczyną zgody na wybór strategii h2 lub h3 , co da wynik [2, 5].
Ciekawa sytuacja zachodzi w przypadku wyboru strategii b3 . Tu, z racji na (minimalnie)
antagonistyczny cel obu graczy, obaj będą dążyli do wyboru innej strategii: gracz A do wyboru
strategii h2 , co dało by wynik [3, 2] gracz B zaś do wyboru strategii h3 , co dałoby wynik [2, 3]
Rzecz jasna nie są to wyniki efektywne13 . Względem każdego z nich, jeden z graczy korzysta na
wyborze strategii h1 . A zatem nie można się spodziewać innego wyniku, jak [3, 3].
W rezultacie można się spodziewać, iż w grze a3 gracz B wybierze strategię b2 , co doprowadzi
do wyniku [2, 5]. Wynik ten jest efektywny, ale z całą pewnością nie zadowoli gracza A. Czy w
jakiś sposób gracz ten może wpłynąć na poprawę swego wyniku? Odpowiedź jest pozytywna.
Gracz A może wysunąć groźbę wobec gracza B, iż w przypadku, gdy ten wybierze strategię b2
on zerwie negocjacje, ustalając strategię h1 , co da wynik [1, 1], nieznacznie gorszy dla gracza
A i znacząco dla gracza B. Jaką alternatywę ma gracz B w przypadku, gdy uzna groźbę za
wiarygodną? Korzystnie będzie dla niego wybrać strategię b3 , co doprowadzi do wyniku [3, 3].
Nie jest to jednakże wynik efektywny. Obaj gracze skorzystaliby wówczas, gdyby gracz B wybrał
strategię b1 , a rezultatem negocjacji byłaby strategia h3 , co dałoby wynik [4, 4]. Słusznie jednakże
gracz B może się obawiać, że w przypadku gdyby wybrał strategię b1 , gracz A zerwie negocjacje,
ustalając w ten sposób strategię h1 , co dałoby wynik [5, 2]. Widać więc, iż korzystnie dla gracza
A może być nie tylko wysunięcie groźby zerwania negocjacji w przypadku wyboru strategii b2 ,
ale również złożenie obietnicy, iż w przypadku, gdy gracz B wybierze strategię b1 , zgodzi się na
wybór strategii h3 .
Gracz A może się więc spodziewać wyniku:
• [2, 5] jeśli nie wysunie groźby wyboru strategii h1 gdy ustalona zostanie strategia b2 ;
• [2, 5] lub [1, 1], jeśli gracz B nie uzna za wiarygodną jego groźby ([1, 1] jeśli groźbę spełni
i [2, 5] gdy jej wykonania zaniecha);
• [3, 3] jeśli wysunie wiarygodną groźbę, bez obietnicy, lub z obietnicą, której gracz B nie
uzna za wiarygodną.
• [4, 4] jeśli wysunie wiarygodną groźbę i obietnicę i ją dotrzyma.
• [5, 2] jeśli nie dotrzyma obietnicy (połączonej z groźbą), w którą gracz B uwierzy.
A , V B ],
2. Stworzenie skalarnej miary oceny (VilA ) poszczególnych wyników gry [Vijl
ijl
odpowiadającej celowi, do jakiego dążył będzie gracz A (indywidualnie efektywny lub
13
Do takich (nieefektywnych) wyników prowadzą strategie antagonistyczne.
37
miarę.
Gracz A rozgrywa grę w sposób minimalnie antagonistyczny. Zatem do oceny poszczególnych
wartości wypłat przyjmie następujące kryterium skalaryzujące:
V A [V A , V B ] = wA · V A − wB · V B .
(2.29)
Dla spełnienia warunku wA wB , przyjmiemy wA = 100, wB = 1.
Zgodnie z analizami przeprowadzonymi uprzednio wyniki rozegrania poszczególnych gier
pojedynczych mogą być następujące:
• w grze a1 : [2, 3], [2, 2], [5, 3] lub [3, 5];
• w grze a2 : [4, 4] lub [2, 3] – zakładamy tu, iż gracz A wysunie wobec gracza B obietnicę
wyboru strategii h3 w przypadku, gdy zostanie wybrana strategia b2 , co może doprowadzić
do wyniku [4, 4]. W momencie rozgrywania gry podwójnej (ustalania ceny na rynku detalicznym A gracz A jednakże nie może mieć pewności, iż gracz B obietnicę przyjmie, stąd
możliwy wynik [2, 3].
• w grze a3 : [2, 5], [3, 3] lub [5, 2] – zakładamy tu, iż gracz A wysuwa wobec gracz B groźbę
zerwania negocjacji (wyboru strategii rekomendowanej h1 ) w przypadku, gdy gracz B
wybierze strategię b2 oraz obietnicę zgody na strategię h3 , w przypadku wyboru strategii
b1 . Gracz A nie zamierza jednakże dotrzymać ani groźby, ani obietnicy. Jeśli gracz B nie
uwierzy ani w groźbę gracza A ustali się wynik [2, 5]. Jeśli uwierzy w groźbę, ale nie uwierzy
w obietnicę, ustali się wynik [3, 3]. Jeśli uwierzy i w groźbę i w obietnicę - ustali się wynik
[5, 2].
Poszczególnym wynikom odpowiadają więc następujące wartości skalarne:
• w grze a1 :
V A [2, 3] = 100 · 2 − 1 · 3 = 197.
V A [2, 2] = 100 · 2 − 1 · 2 = 198.
V A [5, 3] = 100 · 5 − 1 · 3 = 497.
V A [3, 5] = 100 · 3 − 1 · 5 = 295.
• w grze a2 :
V A [4, 4] = 100 · 4 − 1 · 4 = 396.
V A [2, 3] = 100 · 2 − 1 · 3 = 197.
38
• w grze a1 :
V A [2, 5] = 100 · 2 − 1 · 5 = 195.
V A [3, 3] = 100 · 3 − 1 · 3 = 297.
V A [5, 2] = 100 · 5 − 1 · 2 = 498.
Poszczególne gry opisać więc można następującymi wektorami wartości skalarnych, odpowiadających wartościom potencjalnie możliwym do uzyskania w tych grach wynikom:
– gra a1 – wektor [197, 198, 497, 295];
– gra a2 – wektor [396, 197];
– gra a3 – wektor [195, 297, 498].
3. Określenie pożądanego sposobu agregacji (agregacja względem strategii hl ) poszczególnych
wartości skalarnych Υ(VilA ) i wybór określonej strategii ai dla której agregat przyjmuje wartość
największą.
Ostateczna ocena danej strategii ai zależna jest od sposobu agragacji, jaki gracz A przyjmie
w celu porównania wektórów wartości skalarnych opisujących możliwe wyniki każdej z gier. Jeśli
gracz A kierował się będzie agregacją Walda postaci:
Υi = min VilA ,
l
wówczas dla poszczególnych gier otrzymamy:
• w grze a1 – Υ1 = min(197, 198, 497, 295) = 197;
• w grze a2 – Υ2 = min(396, 197) = 197;
• w grze a3 – Υ3 = min(195, 297, 498) = 195.
Jeśli gracz A kierował się będzie agregacją optymistyczną postaci:
Υi = max VilA
l
• w grze a1 – Υ1 = max(197, 198, 497, 295) = 497;
• w grze a2 – Υ2 = max(396, 197) = 396;
• w grze a3 – Υ3 = max(195, 297, 498) = 498.
39
Jeśli gracz A kierował się będzie agregacją Laplace’a postaci:
Υi (VilA ) =
1X A
V .
L l il
• w grze a1 – Υ1 = 14 (197 + 198 + 497 + 295) = 296, 75;
• w grze a2 – Υ2 = 12 (396 + 197) = 296, 5;
• w grze a3 – Υ3 = 13 (195 + 297 + 498) = 330.
Niezależnie od sposobu agregacji gracz A winien wybrać taką strategię ak , która da mu
największą wartość agregatu Υk :
ak = arg max Υi .
i
Zatem w przypadku wyboru agregacji Walda gracz A winien wybrać strategię a1 lub a2 .
Natomiast przyjmując agregację optymistyczną lub Laplace’a – strategię a3 . Wybór określonej
strategii winien być jednakże poparty głębszą analizą. Dla przykładu, w przypadku wyboru
agregacji optymistycznej maksymalna wartość skalarna dla gry a3 jest minimalnie lepsza (równa
498) od wartości z gry a1 (równa 497). Przeprowadzona analiza szacuje jedynie wartości liczbowe,
odzwierciedlające poszczególne wyniki gry. Liczby te jednakże nie uwzględniają zysków i strat
innej natury. Jak pamiętamy, w grze a3 wartość najlepszą 498 gracz A uzyskać może jedynie
wówczas, gdy uprzednio wysunie wobec gracza B groźbę, a ponadto złoży obietnicę, której nie
dotrzyma. Liczba 498 nie uwzględnia więc ani kosztów poniesionych na reputacji gracza B, ani
też jego kosztów moralnych. Wartość 497, odpowiadająca najlepszemu wynikowi z gry a1 , choć
zapewne nie jest prostszą od poprzedniej do uzyskania, to jednakże pozostawia lepszym obraz
gracza A tak zarówno w jego własnych, jak też konkurenta oczach.
40
Rozdział 3
Ustalona kolejność ruchów – gracz A
nie zna sposóbu rozegrania gry
pojedynczej przez gracza B
W dalszym ciągu rozważamy przypadek, gdy w grze podwójnej gracz A wykonuje ruch jako
pierwszy (czy to w sensie ustalenia cen na rynku detalicznym A, czy w sensie negocjowania
cen na rynku hurtowym H). Tym razem zakładamy, iż gracz A nie zna sposóbu rozegrania gry
pojedynczej przez gracza B, a więc nie wie, czy gracz B dążył będzie do celu indywidualnie
efektywnego, czy też do celu antagonistycznego.
Na wstępie należy stwierdzić, iż jest to przypadek bardziej prawdopodobny. W szczególności będzie tak wówczas, gdy pierwszym ruchem w grze podwójnej będzie proces ustalania cen
detalicznych przez gracza A. W przypadku, gdy pierwszym ruchem byłby proces negocjacji H,
gracz A mógłby uzyskać pewne informacje o sposobie rozegrania gry pojedynczej na podstawie
sposobu negocjowania gracza B (pierwszy ruch w grze podwójnej). I tu jednakże należałoby
wziąć poprawkę na fakt, iż zespół negocjatorów operatora B mógłby mieć niewielki wpływ na
decyzje cenowe podejmowane na rynku detalicznym (B), jak też na fakt, iż sposób negocjowania
mógłby być elementem swoistej manipulacji percepcją gracza A, w kwestii dalszego sposobu
rozgrywania gry przez gracza B. A zatem w wielu przypadkach założenie o nieznajomości przez
gracza A, w trakcie rozgrywania gry podwójnej, sposobu rozegrania gry pojedynczej przez gracza
B, będzie założeniem poprawnym.
Podobnie jak poprzednio problem rozpatrzymy w dwóch osobnych przypadkach:
• Pierwszym ruchem w grze podwójnej jest proces negocjacji stawek rozliczeniowych na
rynku hurtowym – H
41
ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY
42
• Pierwszym ruchem w grze podwójnej jest proces ustalania cen na rynku detalicznym gracza
A
3.1
Pierwszym ruchem w grze podwójnej jest proces negocjacji
stawek rozliczeniowych na rynku hurtowym – H
W przypadku, gdy w grze podwójnej pierwszym ruchem jest proces negocjacji stawek rozliczeniowych na rynku hurtowym – H, w grze pojedynczej możliwe są dwa przypadki kolejności
ruchów: AB i BA. Rozważymy każdy z nich osobno.
3.1.1
W grze pojedynczej pierwszy rusza się gracz A: przypadek HAB
By rozstrzygnąć dylemat, w jaki sposób rozegrać grę podwójną, o jaką ze strategii hl w trakcie
negocjacji zabiegać, gracz A musi rozstrzygnąć w jaki sposób rozegra, którą ze strategii ai
wybierze w poszczególnych grach pojedynczych hl oraz przewidzieć i oszacować skutki, jakie za
sobą pociągnie określona, jednakże a priori nie znana graczowi A odpowiedź gracza B.
Stojąc przed koniecznością ruszania się jako pierwszy w grze pojedynczej, gracz A ma ograniczone możliwości stosowania strategii antagonistycznych. Skutek ich stosowania byłby na dodatek
trudny do przewidzenia w kontekście nieznanego sposobu rozegrania gry przez gracza B. W
szczególności gracz A musi się liczyć z tym, iż określoną, antagonistyczną strategię gracza A
gracz B może odebrać jako prowokację, co doprowadzić może do takiej odpowiedzi, która da
graczowi A wynik znacząco różny od tego, który chciałby otrzymać.
Do rozwiązania problemu decyzyjnego gracza A zastosować można następującą metodę:
Metoda: Wybór strategii gry w grze podwójnej HAB z założeniem, że gracz A nie zna
celu do jakiego dąży gracz B
1. Określenie dla każdej strategii ai z poszczególnych gier pojedynczych, potencjalnie możliA , V B ].
wych odpowiedzi gracza B (strategii bj ) i odpowiadających im wyników [Vijl
ijl
A ) poszczególnych wyników gry [V A , V B ], odpowiada2. Stworzenie skalarnej miary oceny (Vijl
ijl ijl
jącej celowi, do jakiego dążył będzie gracz A (indywidualnie efektywny lub antagonistyczny)
i przypisanie poszczególnym wynikom ich wartości wyznaczonej przez tą miarę.
3. Określenie pożądanego sposobu agregacji (agregacja względem strategii bj ) poszczególnych
wartości skalarnych Υ(VilA ) i wskazanie strategii ai , dla której agregat przyjmuje wartość
największą, jako strategia, którą gracz A powinien w danej grze pojedynczej hl wybrać.
43
Wartość agregatu Υ(VilA ) odpowiadająca wybranej strategii ai określa wartość danej gry
pojedynczej dla gracza A.
4. W trakcie negocjacji H gracz A winien zabiegać o wybór tej strategii hl , której odpowiada
gra pojedyncza hl o największej wartości (agregatu Υ(VlA )).
Użyteczność powyższej metody zostanie omówiona na przykładzie.
Przykład 3.1
Operator wirtualnej sieci komórkowej (MVNO) A rozpoczyna negocjacje dotyczące możliwości korzystania z infrastruktury operatora operatora sieci komórkowej B. W zależności od
kształtu wynegocjowanej umowy operator A rozważa trzy możliwe oferty usługowe dla własnych użytkowników końcowych: a1 , a2 i a3 . Dopuszcza, że gracz B nie pozostanie bierny na tę
sytuację i wprowadzi na własny rynek detaliczny jedną z trzech ofert: b1 , b2 lub b3 (przypadek
HAB).
Oferta b1 jest najbardziej stonowaną, zbliżoną do oferty a1 , która zdaniem analityków operatora A doprowadzi do względnego zrównoważenia sił obu graczy na rynku. Szacuje się, iż
wdrożenie oferty b3 może znaczącą osłabić pozycję operatora A na rynku, jednakże nie bez
szkody finansowej dla gracza B. Celem gracza A jest jak najszybsze pozyskanie możliwie dużego
udziału w rynku (gra o udział w rynku). Gracz B zasadniczo skupiony jest na maksymalizacji
zysku (gra o zysk). Gracz A dopuszcza jednak, iż uwaga gracza B może jednak zostać skupiona na maksymalizacji zysku w dłuższej perspektywie, co w praktyce może oznaczać chęć
ograniczenia udziału w rynku gracza A, nawet kosztem tymczasowych strat finansowych. Gracz
A nie ma jednak pewności, czy na taki sposób rozegrania gry gracz B się zdecyduje.
W ramach negocjacji dotyczących możliwości korzystania z infrastruktury operatora B operator A rozważa albo zabieganie o zawarcie umowy określonej na zasadach wyrażonych w strategii
h1 albo przyjęcie rozwiązania rekomendowanego przez regulatora rynku (strategia h2 ).
Macierz wypłat graczy przedstawia się jak w tabeli 3.1. Problem decyzyjny gracza A sprowadza
się do pytania o wybór której ze strategii hl w trakcie prowadzonych w ramach gry podwójnej
negocjacji winien zabiegać.
W celu rozwiązania tego problemu prześledzimy kolejne kroki przedstawionej wyżej metody.
1. Określenie dla każdej strategii ai z poszczególnych gier pojedynczych, potencjalnie możliwych
A , V B ].
odpowiedzi gracza B (strategii bj ) i odpowiadających im wyników [Vijl
ijl
Rozważmy każdą z gier pojedynczych hl osobno.
44
Tabela 3.1: Macierz wypłat w grze z ustaloną kolejnością HAB, w której gracz A nie
zna sposobu rozegrania gry przez gracza B.
h1
h2
b1
b2
b3
b1
b2
b3
a1
[5,5]
[3,4]
[1,3]
a1
[4,4]
[4,3]
[2,3]
a2
[4,3]
[3,4]
[3,2]
a2
[3,2]
[2,3]
[1,1]
a3
[3,2]
[3,3]
[2,1]
a3
[3,1]
[2,2]
[3,4]
Analiza gry h1
• Gracz A wybiera strategię a1
Jeśli gracz B odpowie strategią efektywną b1 wówczas usali się wynik [5, 5]. Jeśli gracz B
odpowie strategią maksymalnie antagonistyczną b3 wówczas ustali się wynik [1, 3]. Jeśli
gracz B odpowie w sposób umiarkowanie antagonistyczny wówczas ustali się wynik [3, 4].
Z punktu widzenia gracza A rozsądnie jest tu zatem przyjąć, iż gracz B wybrać może
każdą spośród dostęnych tu strategii.
Jeśli gracz B odpowie w sposób indywidualnie efektywny, wybierając strategię b2 , wówczas
ustali się wynik [3, 4]. Jest to w tym przypadku praktycznie jedyna odpowiedź, której gracz
A może się ze strony gracza B spodziewać. Nie wydaje się bowiem zbyt prawdopodobnym,
by gracz B ze stratą dla siebie wybrał strategię b1 , co poprawiłoby na dodatek wypłatę
gracza A (wynik [4, 3]), lub strategię b3 , która bez zmiany wartości wypłaty gracza A
pogorszyłaby wypłatę gracza B (wynik [3, 2]). W przypadku wyboru strategii a2 gracz A
może być zatem pewien wyniku [3, 4], a jeśliby jednak wynik miałby być inny, to będzie
to dla niego jedynie miłą niespodzianką.
Jeśli gracz A wybierze strategię a3 , odpowiedzią gracza B z pewnością nie będzie strategia b1 , ta bowiem dałaby graczowi B wypłatę gorszą, niż w przypadku wyboru strategii
b2 , bez zmiany wartości wypłaty gracza A. Ostatecznie gracz B odpowiedzieć więc może
45
albo efektywną strategią b2 , co doprowadzi do wyniku [3, 3] albo antagonistyczną b3 , co
doprowadzi do wyniku [2, 1].
Analiza gry h2
Jeśli gracz A wybierze strategię a1 , gracz B z pewnością nie odpowie strategią b2 . Korzystniej byłoby dla gracza B, a bez różnicy z punktu widzenia wypłaty gracza A byłoby wybrać
strategię b1 , co doprowadziłoby do efektywnego wyniku [4, 4]. Gracz B odpowiedzieć jeszcze
może antagonistyczną strategią b3 , co doprowadziłoby do wyniku [2, 3].
W przypadku wyboru przez gracza A strategii a2 , gracz B odpowie strategią b2 lub b3 . W
ten sposób ustali się wynik [2, 3] lub [1, 1]. Strategii b1 gracz B nie powinien wybrać, bowiem
przyniosłoby to mu wynik gorszy niż w przypadku strategii b2 , a przy tym poprawiłoby
wynik gracza A.
Jeśli gracz A wybierze strategię a3 , może się spodziewać, iż odpowiedzią gracza B będzie
albo strategia b2 , co dałoby wynik [2, 2], albo strategia b3 , co da wynik [3, 4]. Strategia
b1 względem strategii b3 nie zmieniłaby wartości wypłaty gracza A pogorszając wypłatę
gracza B.
Podsumowując powyższe zestawienia gracz A może się spodziewać następujących wyników:
• [5, 5], [3, 4] lub [1, 3] dla h1 i a1 ;
• [3, 4] dla h1 i a2 ;
• [3, 3] lub [2, 1] dla h1 i a3 ;
• [4, 4] lub [2, 3] dla h2 i a1 ;
• [2, 3] lub [1, 1] dla h2 i a2 ;
• [2, 2] lub [3, 4] dla h2 i a3 ;
46
A ) poszczególnych wyników gry [V A , V B ],
2. Stworzenie skalarnej miary oceny (Vijl
ijl ijl
odpowiadającej celowi, do jakiego dążył będzie gracz A (indywidualnie efektywny lub
miarę.
Zanim ustalimy cel, do jakiego w rozpatrywanej grze dążył będzie gracz A warto w tym
miejscu rozważyć, jak sposób rozegrania gry przez gracza A może wpłynąć na sposób rozegrania
gry przez gracza B. Rozważmy dla przykładu następujące rozumowanie. Załóżmy, iż gracz A
przypuszcza, że gracz B dążył będzie do celu indywidualnie efektywnego. Gracz A zastanawia
się nad wyborem jednego z dwóch scenariuszy: h1 i a3 lub h2 i a2 . Jeśli gracz A dążył będzie do
celu minimalnie antagonistycznego, wówczas powinien wybrać scenariusz h2 i a2 (przy założeniu, że tylko te dwa sceneriusze są dostępne). Przy tym scenariuszu wynikiem będzie [2, 3] jeśli
gracz B odpowie indywidualnie efektywną strategią b2 , lub [1, 1] jeśli gracz B odpowie w sposób
antagonistyczny wybierając strategię b3 . Niezależnie od sposobu rozegrania gry przez gracza B,
bez straty dla gracza A da to wynik gorszy dla gracza B, niżby to było w przypadku scenariusza
h1 i a3 , kiedy to dostępnymi wynikami byłyby [3, 3] lub [2, 1]. Owo pogorszenie wyniku gracza B
jest zgodne z antagonistycznym nastawieniem gracza A. Możliwym jednak jest, iż cel do jakiego
dążył będzie gracz B zależny będzie od scenariusza, jaki wybierze gracz A. Dla przykładu, jeśli
gracz A wybierze scenariusz h1 i a3 , gracz B może być skłonny zagrać w sposób indywidualnie
efektywny, wybierając strategię b2 i ustalając w ten sposób wynik [3, 3]. Jednakże wybór scenariusza h2 i a2 gracz B potraktować może (i słusznie) jako antagonistyczne podejście do gry ze
strony gracza A i w efekcie odpowiedzieć również w sposób antagonistyczny, wybierając strategię
b3 i doprowadzając do wyniku [1, 1]. Jednym słowem jawny antagonizm (choćby i minimalny)
ze strony gracza A sprowokować może antagonizm po stronie gracza B, mimo pierwotnego założenia o rozegraniu gry w sposób indywidualnie efektywny. Wynik więc może być radykalnie
różny od tego, do jakiego pierwotnie dążył gracz A, a dążenie do realizacji określonego celu (tu
minimalnie antagonistycznego) prowadzić może do rozwiązania odbiegającego od tego celu w
sposób daleki.
O ile rozpatrywane w tym punkcie tworzenie skalarnej miary wyników gry, odpowiada celowi
do jakiego dąży gracz A, o tyle cel do jakiego dąży gracz B ujęty zostanie w następnym punkcie,
poprzez określenie odpowiedniego sposobu agregacji. Z powyższej analizy widać, iż właściwym
podejściem może się okazać, tworzenie różnych sposobób agragacji dla różnych scenariuszy gry.
Pozostając jednakże przy problemie tworzenia skalarnej miary oceny poszczególnych wyników
gry warto w tym miejscu też zasygnalizować, że właściwym podejściem do tworzenia tej miary w
przypadku, gdy gracz A dążył będzie do celu indywidualnie efektywnego, będzie uwzględnienie w
tej mierze nie tylko wartości wypłaty gracza A, ale również wartości wypłaty gracza B. Co więcej,
47
w interesie gracza A winno być tej wypłaty maksymalizowanie. Takie podejście w maksymalny
sposób sprzyjać będzie temu, by gracz B nie odpowiedział w sposób antagonistyczny.
Załóżmy więc, że gracz A dąży do celu indywidualnie efektywnego, a skalarna miara oceny
przyjmie następującą postać:
V A [V A , V B ] = wA · V A + wB · V B ,
(3.1)
przy czym wA = 100, wB = 1.
Stąd dla poszczególnych scenariuszy gry i odpowiadających im możliwych wyników otrzymujemy:
• Scenariusz h1 i a1 :
V A [5, 5] = 100 · 5 + 1 · 5 = 505.
V A [3, 4] = 100 · 3 + 1 · 4 = 304.
V A [1, 3] = 100 · 1 + 1 · 3 = 103.
V A [3, 4] = 100 · 3 + 1 · 4 = 304.
V A [3, 3] = 100 · 3 + 1 · 3 = 303.
V A [2, 1] = 100 · 2 + 1 · 1 = 201.
V A [4, 4] = 100 · 4 + 1 · 4 = 404.
V A [2, 3] = 100 · 2 + 1 · 3 = 103.
V A [2, 3] = 100 · 2 + 1 · 3 = 203.
V A [1, 1] = 100 · 1 + 1 · 1 = 101.
V A [2, 2] = 100 · 2 + 1 · 2 = 202.
V A [3, 4] = 100 · 3 + 1 · 4 = 304.
48
Przed przejściem do kolejnego kroku metody, gracza A może już w tym momencie wyeliminować te scenariusze gry, które w świetle celu, do którego dąży są zdominowane. Za zdominowane
w sensie określonego celu gry uznaje się te scenariusze, dla których można znaleźć inny scenariusz, który ma:
1. tyle samo możliwych wyników gry, a odpowiadający tym wynikom wektor uporządkowanych
(np. malejąco) wartości skalarnych dominuje wektor wartości odpowiadających scenariuszowi zdominowanemu;
2. mniej możliwych wyników gry, przy czym odpowiadający tym wynikom wektor uporządkowanych wartości skalarnych dominuje pod-wektor o tym samym wymiarze największych
wartości skalarnych odpowiadających scenariuszowi zdominowanemu;
3. więcej możliwych wyników gry, przy czym odpowiadający tym wynikom pod-wektor najmniejszych wartości skalarnych o tym samym wymiarze co wektor odpowiadający scenariuszowi zdominowanemu, ów wektor dominuje.
I tak dla przykładu scenariusz h2 i a3 , któremu odpowiadaja wektor wartości skalarnych
[304, 202] dominuje (w sensie pierwszej z powyższych definicji dominacji) scenariusz h2 i a2 ,
któremu odpowiada wektor wartości skalarnych [203, 101], a także scenariusz h1 i a3 , któremu
odpowiada wektor wartości skalarnych [303, 201]. A zatem scenariusze h2 i a2 oraz h1 i a3 , jako
zdominowane można usunąć z dalszej analizy, bowiem nie jest w interesie gracza A dążenie do
ich zrealizowania.
Gracz A mógłby jednakże pozostawić do dalszej analizy scenariusz h1 i a3 z tego względu, iż
choć jest od zdominowany przez scenariusz h2 i a3 , to jednak odpowiada wyborowi innej strategii
na rynku hurtowym hl . Jeśli okazałoby się, że w trakcie negocjacji zostanie wybrana strategia
h1 , wówczas scenariusz h1 i a3 jest w dalszym ciągu warto rozważenia. W omawianym jednak w
tym miejscu przykładzie, kiedy to strategia h2 jest strategią rekomendowaną przez regulatora,
gracz A może mieć pewność, że jeśli tylko uzna za stosowne dążyć do realizacji scenariusza h2 i
a3 to uda mu się to uczynić. A zatem scenariusz h1 i a3 można usunąć z analizy.
W sensie drugiej z powyższych definicji dominacji scenariusz h2 i a3 , któremu odpowiada wektor wartości skalarnych [304, 202] jest zdominowany przez scenariusz h1 i a2 , któremu
odpowiada wektor [304]. Scenariusza h2 i a3 jednakże nie warto w tym miejscu usuwać z dalszej
analizy, bowiem gracz A nie może mieć pewności, czy w przypadku chęci wybrania scenariusza
h1 i a2 , uda mu się doprowadzić do tego, by w trakcie negocjacji wybrana została strategia h1 .
W ten sposób przechodząc do następnego kroku metody gracz A rozważa poniższe scenariusze, wraz z odpowiadającymi im wektorami wartości skalarnych:
49
• Scenariusz h1 i a1 : wektor wartości skalarnych [505, 304, 103].
• Scenariusz h1 i a2 : wektor wartości skalarnych [304].
• Scenariusz h2 i a1 : wektor wartości skalarnych [404, 103].
• Scenariusz h2 i a3 : wektor wartości skalarnych [304, 202]
3. Określenie pożądanego sposobu agregacji (agregacja względem strategii bj ) poszczególnych
wartości skalarnych Υ(VilA ) i wskazanie strategii ai , dla której agregat przyjmuje wartość
największą, jako strategia, którą gracz A powinien w danej grze pojedynczej hl wybrać. Wartość
agregatu Υ(VilA ) odpowiadająca wybranej strategii ai określa wartość danej gry pojedynczej dla
gracza A.
Trzeci krok ilustrowanej metody jest bez wątpienia krytyczny w całym procesie analizy sytuacji decyzyjnej gracza A. Nie znając celu do jakiego w ostatnim ruchu gry dążył będzie gracz B,
gracz A musi zadecydować, jaką wartość mają dla niego poszczególne gry pojedyncze, spośród
których będzie chciał jedną wybrać w trakcie przeprowadzanych w ramach gry podwójej negocjacji. Aby przypisane poszczególnym grom wartości, pozwalały uszeregować te gry w porządek
zupełny [15, 21], co umożliwi graczowi A określenie najlepszej z nich, wartości te nie mogą
być wektorami, ale skalarami. Gracz A musi więc dokonać agregacji poszczególnych wektorów
wartości skalarnych odpowiadających poszczególnym scenariuszom gry. Rodzaj agregacji, jaki
przyjmie gracz A odpowiada w istocie przypuszczeniu, do jakiego celu dążył będzie gracz B. Na
tym polega krytyczność owego kroku.
W najprostszym podejściu, gracz A może założyć całkowitą niepewność odnośnie celu, do
jakiego dążył będzie gracz B i przyjąć odpowiadającą jego (A) stosunkowi do tej niepewności
określoną formę agregacji: Walda, optymistyczną, Laplace’a, Hurwicza itp. Dla przykładu, jeśli
gracz A charakteryzował się będzie maksymalną awersją do ryzyka, wówczas powinien przyjąć
agregację Walda postaci:
A
Υ(VilA ) = min Vijl
.
j
(3.2)
Jeśli będzie neutralny względem ryzyka, wówczas największą wartość będzie miał dla niego ten
scenariusz, dla którego wartość oczekiwana ze skalarnych miar oceny przyjmie wartość największą. W takiej sytuacji powinien przyjąć agregację Laplace’a postaci:
Υ(VilA ) =
1X A
V .
J j ijl
(3.3)
50
Niezależnie od przyjętego sposobu agregacji, artość gry hl – Υ(VlA ) wyznacza się jako największa z wartości Υ(VilA ) dla ustalonej strategii hl , czyli zgodnie z zależnością:
Υ(VlA ) = max VilA .
(3.4)
i
Dla określenia wartości poszczególnych scenariuszy gry, a po przez to ostatecznie i wartości poszczególnych gier pojedynczych, gracz A może wykorzystać również zawarte w macierzy
wypłat informacje, na tema opłacalności z punktu widzenia gracza B stosowania różnych strategii antagonistycznych. Na podstawie tych informacji gracz A może oszacować prawdopodobieństwo tego, że gracz B wybierze, lub nie wybierze danej strategii bj w ramach określonego scenariusza hl i ai . Do określenia wartości tego prawdopodobieństwa posłużyć może współczynik
antagonistycznej zachęty do wyboru określonej bj [9]:
B
Υ̃ilj =
n
o
n
o , (3.5)
VilBmax · max VilAmax − VjlA (ai ), VilAmax · max VilBmax − VilB (bj ), przy czym VilBmax oraz VilAmax są wartościami wypłat odpowiednio gracza B i gracza A, w sytuacji
gdy gracz B odpowiada w sposób indywidualnie efektywny, a jest współczynnikiem przyjmującym małą wartość (np. = 0, 01).
Dla przykładu scenariusze h2 i a1 oraz h2 i a3 mają różną miarę zachęty do odpowiedzi
antagonistycznej gracza B. Rozważmy oba scenariusze.
• W scenariszu h2 i a1 antagonistyczną odpowiedzią gracza B jest strategia b3 prowadząca
do wyniku [1, 3] (strategią indywidualnie efektyną jest strategia b1 prowadząca do wyniku
[4, 4]). Stąd:
3
Υ̃B
12 =
n
o
n
o =
Bmax
Amax
A (a ), V12
· max V12
− V32
1
Bmax
Amax
B (b ), V12
· max V12
− V12
3
n
o
n
o = 3.
4 · max 4 − 1, 0.01
4 · max 4 − 3, 0.01
• W scenariszu h2 i a3 antagonistyczną odpowiedzią jest strategia b2 prowadząca do wyniku
[2, 2] (strategią indywidualnie efektyną jest strategia b3 prowadząca do wyniku [3, 4]). Stąd:
2
Υ̃B
32 =
n
o
n
o =
Bmax
Amax
A (a ), V32
· max V32
− V22
3
Amax
Bmax
B (b ), V32
· max V32
− V32
2
n
o
n
o = 1/3.
4 · max 3 − 2, 0.01
3 · max 4 − 2, 0.01
Widać zatem, iż dla scenariusza h2 i a1 gracz B odczuwał będzie dużo silniejszą (dziewięmax
ciokrotnie większą w sensie wartości współczynnika ΥB
) zachętę do odpowiedzi antagoil
nistycznej aniżeli w przypadku scenariusza h2 i a3 . Można się zatem spodziewać, iż strategia
ta będzie z większym prawdopodobieństwem wybrana. Zanim jednakże zaproponujemy miary
51
prawdopodobieństwa oparte na współczynnikach antagonistycznej zachęty do wyboru określonej
strategii bj wyznaczymy wartości tych współczynników dla poszczególnych strategii w ramach
rozważanych scenariuszy z gry h1 .
• W scenariuszu h1 i a2 istnieje jedna strategia, możliwa do wybrania przez gracza B – b2 ,
prowadząca do wyniku [3, 4]. Jest to strategia indywidualnie efektywna. Gracz B nie ma
więc w tym scenariuszu możliwości wyboru strategii antagonistycznej.
• W scenariuszu h1 i a1 dostąpne są dwie strategie antagonistyczne: b2 i b3 prowadzące
odpowiednio do wyników [3, 4] i [1, 3] (strategią indywidualnie efektyną jest strategia b1
prowadząca do wyniku [5, 5]). Stąd dla strategii b2 otrzymujemy:
2
Υ̃B
12 =
n
o
n
o =
Bmax
Amax
A (a ), V11
· max V11
− V21
1
Amax
Bmax
B (b ), V11
· max V11
− V11
2
n
o
n
o = 2.
n
o
n
o = 2.
5 · max 5 − 3, 0.01
5 · max 5 − 4, 0.01
natomiast dla strategii b3 otrzymujemy:
3
Υ̃B
11 =
n
o
n
o =
Bmax
Amax
A (a ), V11
· max V11
− V31
1
Bmax
Amax
B (b ), − V11
· max V11
V11
3
5 · max 5 − 1, 0.01
5 · max 5 − 3, 0.01
Miara zachęty do wybrania strategii antagonistycznej nie odzwierciedla w pełni wewnętrznych
motywów, jakimi kierować się może w swych odpowiedziach gracz B. Miara ta jedynie pokazuje
siłę ciążenia w stronę określonych strategii antagonistycznych, wynikającą z chęci pogorszenia
wypłaty gracza A przy możliwie małym własnym koszcie. Aby odzwierciedlić pełnię wewnętrznych
motywów należałoby stworzyć również odpowiednie miary zachęty do gry w sposób indywidualnie efektywny, jak również do gry w sposób altruistyczny1 , a następnie dla każdej strategii bj
dokonać swoistej agregacji owych miar, wynikących z różnych wewnętrznych motywów. Wydaje się jednak, iż to rozumowanie stanowi jedynie ogląd ciekawej i na swój sposób atrakcyjnej
ideii, która jednakże pozostać musi w formie abstrakcyjnej. Rozważany problem jest jednakże
rzeczywisty, a więc – choćby kosztem znaczących uproszczeń – należy nim się zająć. Przyjmiemy
więc, iż gracz A zakłada, iż gracz B w swych decyzjach kierował się będzie jedynie motywami
antagonistycznymi, co nie musi oznaczać bynajmniej, iż nie jest zainteresowany wyborem takiej
strategii bj , która zostałaby wybrana również wtedy, gdyby gracz B kierował się celem indywidualnie efektywnym2 . Przyjmiemy, iż strategia indywiudualnie efektywna traktowana będzie
w jednakowy sposób, jak strategia antagonistyczna, dla której współczynnik antagonistycznej
1
Choć doświadczenie realnych gier rynkowych nakazywałaby graczowi A raczej zakładać, iż te ostatnie nie
będą w rzeczywistości dochodzić do głosu.
2
W istocie, w przypadku gdy strategia indywidualnie efektywna wskazuje w sposób jednoznaczny na określoną
strategię bj , to na tę samą strategię wskazuje strategia minimalnie antagonistyczna.
52
zachęty przyjmuje wartość jeden (w istocie, taką wartość przyjmuje ten współczynnik dla strategii indywidualnie efektywnej).
Wobec powyższego zdefiniować możemy miarę prawdopodobieństwa wyboru określonej strategii bj , dla określonego scenariusza hl i ai :
B
Υ̃ j
pilj = P ilB ,
k
k Υ̃il
(3.6)
przy czym sumowanie w mianowniku odbywa się jedynie w ramach możliwych do wybrania przez
gracza B strategii bk , dla określonego scenariusza hl i ai .
Wobec powyższego otrzymamy:
• Dla scenariusza h1 i a1 :
p11
1 =
1
= 1/5,
1+2+2
2
= 2/5,
1+2+2
2
=
= 2/5.
1+2+2
p11
2 =
p11
3
p21
2 = 1.
p11
1 =
1
= 1/4,
1+3
p11
3 =
3
= 3/4.
1+3
1/3
= 1/4,
1 + 1/3
1
=
= 3/4.
1 + 1/3
p32
2 =
p32
3
Korzystając z wprowadzonych wyżej wartości prawdopodobieńst pilj wyboru przez gracza B
określonych strategii bj , dla każdego z rozważanych scenariuszy hl i ai oraz w oparciu o wartości skalarnych miar oceny odpowiadających im wyników gry VilA zdefiniować możemy funkcję
agregacji Υ(VilA ) w postaci:
Υ(VilA ) =
X
j
pilj · VilA .
53
Korzystając z powyższej zależności wyznaczymy wartości poszczególnych scenariuszy w rozważanym
przykładzie.
• Wartość scenariusza h1 i a1 :
A
A
11
A
11
A
Υ(V11
) = p11
1 · V111 + p2 · V121 + p3 · V131 = 1/5 · 505 + 2/5 · 304 + 2/5 · 103 = 263, 8.
• Wartość scenariusza h1 i a2 : wektor wartości skalarnych [304].
A
A
Υ(V12
) = p21
2 · V221 = 1 · 304 = 304.
• Wartość scenariusza h2 i a1 : wektor wartości skalarnych [404, 103].
A
A
12
A
Υ(V12
) = p12
1 · V112 + p3 · V132 = 1/4 · 404 + 3/4103 = 178, 25.
• Wartość scenariusza h2 i a3 : wektor wartości skalarnych [304, 202]
A
A
32
A
Υ(V32
) = p32
2 · V322 + p3 · V332 = 1/4 · 202 + 3/4 · 304 = 278, 5.
Stąd wartość gry h1 wynosi:
n
o
A
Υ(V1A ) = max Vi1
= max 263.8, 304 = 304
i
zaś wartość gry h2 wynosi:
n
o
A
Υ(V2A ) = max Vi2
= max 178.25, 278.5 = 278.5
i
4. W trakcie negocjacji H gracz A winien zabiegać o wybór tej strategii hl , której odpowiada gra
pojedyncza hl o największej wartości (agregatu Υ(VlA )).
Przy założeniu, że gracz A będzie określał wartość poszczególnych gier w oparciu o przedstawioną w poprzednim punkcie formułę agregacji skalarnych miar możliwych do uzyskania wyników
gry dla każdego scenariusza, dochodzimy do wniosku, iż w trakcie rozgrywania gry podwójnej
gracz A powinien zabiegać o wybór strategii h1 , jako tej, która doprowadza do gry pojedynczej
h1 , która ma największą wartość.
Może się to okazać o tyle trudne, iż nie jest ona strategią rekomendowaną przez regulatora,
a zatem, jeśli tylko w interesie gracza B będzie jej odrzucenie, po zakończonych negocjacjach
54
graczom przyjdzie rozegrać grę h2 . Określenie, którą ze strategii opłaca się wybrać graczowi B
możliwe jest jedynie przy założeniu znajomości celu do jakiego zmierza3 .
Jeśli w trakcie negocjacji zostanie wybrana strategia h1 , wówczas gracz A powinien na rynku
detalicznym wprowadzić strategię a2 . Jeśli zaś w trakcie negocjacji zostanie wybrana strategia
h2 , wówczas gracz A powinien wybrać strategię a3 . Ostateczny wynik gry określony zostanie
przez konkretną odpowiedź bj gracza B.
3.1.2
W grze pojedynczej pierwszy rusza się gracz B: przypadek HBA
Próba przewidzenia celu i strategii gracza B
Konieczność wykonywania ruchu jako pierwszy w grze pojedynczej w ogólności osłabia możliwość
i motywację do ryzgrywania gry w sposób antagonistyczny. Wynika to z dwóch powodów:
1. Gracz wykonujący ruch jako pierwszy, jeśli tylko nie zna celu do jakiego dążył będzie
gracz wykonujący ruch jako drugi, nie może jednoznacznie określić wyniku, jaki się w ostateczności ustali. W ten sposób nie jest w stanie przewidzieć ostatecznej wartości własnej
funkcji wypłaty dla gry w sposób antagonistyczny.
2. Przy założeniu znajomości celu do jakiego dąży gracz wykonujący ruch jako drugi, rozgrywanie gry w sposób antagonistyczny przez gracza wykonującego ruch jako pierwszy może
zostać potraktowane jako prowokacja, na którą gracz wykonujący ruch jako drugi odpowie
w sposób niezgodny z pierwotnie zamierzonym celem .
Jakie płyną stąd wnioski dla rozważanego przypadku gry pojedynczej BA, w której gracz
A nie zna celu do jakiego dąży gracz B? Czy można założyć, że sytuacja, w której znajduje
się gracz B przynagla go zmierzania do celu indywidualnie efektywnego? A jeśli nawet wartość
jego własnej funkcji wypłaty stanie się jego podstawową miarą oceny uzyskanego wyniku, to czy
można w ten sposób wskazać jednoznacznie określoną strategię bj , którą w danej grze pojedynczej
hl gracz ten wybierze?
Można by się pokusić o następujące rozumowanie. Przy założeniu, że gracz B nie zna celu do
jakiego dąży gracz A4 , gracz A mógłby wnioskować, iż gracz B, z racji na osłabioną możliwość
i motywację rozgrywania gry w sposób antagonistyczny, dążył będzie do rozgrywania gry w
3
Ten przypadek rozpatrywany był w ramach wcześniejszych analiz przeprowadzonych w punkcie 2.1, przy
założeniu, że gracz A rusza się jako drugi i gracz B zna cel, do jakiego A zmierza. Aby wyniki tamtych analiz
przełożyć na rozważany w tym miejscu przypadek należy zamienić jedynie indeksowanie graczy: A = B, B = A.
4
To założenie tylko z pozoru wygląda na oczywiste. Gracz A rzecz jasna zawsze może sobie pozwolić na ustaloną
w wewnętrznie zmianę celu z zachowaniem jednocześnie dużego prawdopodobieństwa, że gracz B tej informacji
nie będzie posiadał. Z drugiej jednak strony, zewnętrzna sytuacja w pewnym sensie może determinować zbiór
55
sposób indywidualnie efektywny. W ten sposób sprowadzilibyśmy problem do omawianego w
rozdziale 2.1 przypadku, w którym w grze pojedynczej gracz B wykonuje ruch jako pierwszy, a
gracz A zna cel do jakiego dąży gracz B. Jednakże jak wynika z tamtejszych analiz, znajomość
celu do jakiego dąży gracz B w sytuacji, gdy wykonuje on ruch jako drugi nie przekłada się w
sposób jednoznaczny na znajomość strategii bj jaką wybierze. Wynika to z faktu, iż gracz B nie
zna celu do jakiego dąży gracz A. Zgodnie ze wsześniejszymi ustaleniami w interesia gracza A
byłoby poinformowanie gracza B do jakiego celu zamierza dążyć tak, by w ten sposób ułatwić
graczowi B podjęcie decyzji, a co za tym idzie uczynić ją dla siebie bardziej przewidywalną.
To jednakże przeczy pierwotnie przyjętemu założeniu, iż gracz B nie zna celu do jakiego dąży
gracz A. Problem polega więc tu na tym, że jeśli nawet, w sytuacji gdy gracz A wie, że gracz
B nie zna celu, do jakiego A będzie zmierzał, to – na mocy pierwszego uzasadnienia osłabienia
możliwości i motywacji do rozgrywania gry w sposób antagonistyczny – gracz A może z pewnym
prawdopodobieństwem założyć, że B dąży do celu indywidualnie efektywnego, to jednak ta
informacja jest niewystarczająca do tego, by jednoznacznie wskazać strategię bj , którą gracz B
wybierze. Aby tę strategię móc wskazać, gracz A musiałby po pierwsze poinformować gracza B
do jakiego celu sam zmierza (jaką strategię ai wybierze w odpowiedzi na określoną strategię bj ,
a po drugie, musiałby mieć pewność, że gracz B, posiadając już taką informację, mimo wszystko
będzie chciał zmierzać do celu indywidualnie efektywnego. Możliwą jest bowiem sytuacja, że
gracz B, znając cel do jakiego zmierzać będzie gracz A zechce zagrać w sposób antagonistyczny.
Znajomość celu, do jakiego dąży gracz A na nowo przywraca możliwość i motywację rozgrywania
gry przez gracza B w sposób antagonistyczny.
Pierwszy problem, który gracz A musi więc rozstrzygnąć dotyczy wyboru jednej z dwóch
sytuacji:
1. Gra ze znanym (założonym z dużym prawdopodobieństwem) celem gracza B, ale nieznaną
strategią bj .
2. Gra z nieznanym celem gracza B.
Sytuacja pierwsza jest rezultatem nieinformowania gracza B na tema celu, jaki gracz A chce
osiągnąć. Na mocy powyższych analiz gracz A może z pewnym prawdopodobieństwem przyjąć,
że w tej sytuacji gracz B będzie dążył do celu indywidualnie efektywnego. Sytuacja druga jest
rezultatem poinformowania gracza B na temat celu, do jakiego dąży gracz A.
Jeśli gracz A zdecyduje się na wariant pierwszy, wówczas może analizować grę w oparciu o
narzędzia przedstawione w poprzednim rozdziale, w którym rozważany był przypadek, w którym
rozsądnych celów, których znajomość będzie oczywista dla każdego, kto tę sytuację podda analizie (np. operator
mający trudności z płynnością finansową zapewne unikał będzie ruchów, które jego sytuację jeszcze miałyby
pogorszyć).
56
znany graczowi A był cel gracza B 5 , natomiast gracz B nie znał celu gracza A (przypadek HBA).
Jeśli zdecyduje się nieinformować gracza B na temat celu, do jakiego dąży, wówczas użyteczne
będą dla niego narzędzia, przedstawione w dalszej części niniejszego punktu.
Na pierwszy rzut oka wydawać się może, iż wariant pierwszy jest dla gracza A korzystniejszy
i to z dwóch powodów. Pierwszy powód zasadza się na porównaniu obu wariantów. W wariancie
pierwszym gracz A nie zna jedynie konkretnej strategii bj , jaką wybierze gracz B, jednakże zna
(czy może raczej z dużym prawdopodobieństwem przewiduje) cel do jakiego B zmierza, a więc
mógłby przynajmniej w świetle tego celu odrzucić te strategie bj , których wybór nie byłby (w
świetle tego celu) dla gracza B korzystny. Druga korzyść dla gracza A z wyboru tego wariantu
wypływa z faktu możliwości nieinformowania gracza B na temat celu, do jakiego sam zmierza.
Wybór pomiędzy tymi wariantami nie jest jednakże tak prosty. Po pierwsze istotna jest tu
wielkość owego prawdopodobieństwa, że faktycznie gracza B zmierzał będzie do celu indywidualnie efektywnego. Owo prawdopodobieństwo zależy bowiem w głównej mierze nie od tego, że
gracz B w grze pojedynczej rusza się jako pierwszy, ale od wartości miary zachęty do atagonistycznej odpowiedzi gracza A. Jeśli wartość tej miary będzie nieduża, to gracz B może mimo
wszystko wybrać antagonistyczną strategię w przekonaniu, że graczowi A nie będzie opłacało się
odpowiedzieć w sposób antagonistyczny. Innymi słowy gracz B może w określonych przypadkach
z bardzo dużym prawdopodobieństwem odczytać, jaka będzie odpowiedź gracza A na określoną
jego strategię bj , bądącą wyrazem jego antagonistycznego celu.
Przykład 3.2
Dla przykładu w grze pojedynczej z macierzą wypłat jak w tabeli 3.2 wybór strategii b2
jest oczywistym wyrazem antagonistycznego nastawienia gracza B do gracza A. A przy tym, co
łatwo stwierdzić gracz B nie musi się zbytnio obawiać, że w rezulatacie tej decyzji może spotkać
się z jakąś zemstą ze strony gracza A. Rezygnacja z wyboru strategii a3 byłaby bowiem dla
gracza A nazbyt kosztowna.
Po drugie możliwość redukcji liczby strategii bj maleć będzie wraz ze wzrostem liczby strategii
ai , które w odpowiedzi gracza A mógłby wybrać. Wraz ze wzrostem liczby strategii ai wzrastała będzie liczba możliwych wyników dla każdej strategii bj , a co za tym idzie – w ogólności –
tym trudniej będzie wskazać wektory dominujące w sensie mimo wszystko nie dość konkretnie
zdefiniowanego celu, jak chęć uzyskania jak najlepszej wartości wypłaty dla siebie. Konkretyzacja celu domagałaby się tu prócz znajomosci podstawowej miary oceny wyniku gracza B (tu
5
Rzecz jasna zawsze będzie możliwość, iż gracz B kierował się będzie nawet w tej sytuacji celem antagonisty-
cznym, co przy odpowiedniej strukturze macierzy wypłat może nie być trudne.
57
Tabela 3.2: Odwaga gry w sposób antagonistyczny przez gracza B.
a1
a2
a3
b1
[3,2]
[4,3]
[6,5]
b2
[2,0]
[3,0]
[6,4]
maksymalizacja wartości jego funkcji), również znajomości jego stosunku do ryzyka, związanego
z potencjalną odpowiedzią gracza A.
Paradoksalnie, nieznajomość celu do jakiego dąży gracz A, co zawsze może zostać uznane,
za dążenie do celu antagonistycznego, może stanowić doskonałe usprawiedliwienie dla realizacji
antagonistycznego celu gracza B.
Przykład 3.3
Jeśli dla przykładu macierz przedstawia się jak w tabeli 3.3 wybór strategii b2 może być
motywowany tak zarówno antagonizmem gracza B, jak też indywidualnie efektywnym celem
połączonym z obawą przed antagonizmem gracza A.
Tabela 3.3: Trudność z odczytaniem motywacji gracza B: mądrość, czy antagonizm?.
a1
a2
b1
[1, 3]
[3, 4]
b2
[2, 1]
[2, 1]
W szczególnych przypadkach rozsądnym podejściem ze strony gracza A może się okazać
podejście polegające na poinformowaniu gracza B na temat celu, do jakiego gracz A dążył
będzie w grze pojedynczej (deklaracja gry w sposób indywidualnie efektywny) i założenie, że
gracz B dążył będzie do celu indywidualnie efektywnego obawiając się, iż potencjalna strategia
antagonistyczna bj zostanie przez gracza A odebrana jako prowokacja. Gracz A może też złożyć
deklarację warunkową, że grał będzie w sposób indywidualnie efektywny, jeśli gracz B grał będzie
w ten sam sposób, a zarazem, że jego odpowiedź będzie antagonistyczna, jeśli gracza B zagra w
sposób antagonistyczny.
58
Przykład 3.4
Dla przykładu w przypadku gry pojedynczej z macierzą wypłat jak w tabeli 3.4 w oczywisty
sposób strategia b2 jest antagonistyczną strategią gracza B, uniemożliwiającą uzyskanie graczowi
A największej, dostępnej dla strategii b1 wartości wypłaty równej 6 (wynik odpowiedzi a4 ). Będąc
na etapie rozgrywania gry podwójnej, do określenia wartości przedstawionej gry pojedynczej
gracz A potrzebuje wiedzieć, do jakiego celu dążył będzie gracz B, co w tym przypadku oznacza
odpowiedź na pytanie, którą ze strategii bj gracz B wybierze. W tej sytuacji, jeśli gracz A dąży
do celu indywidualnie efektywnego, to w jego interesie jest poinformowanie gracza B, że zamierza
rozegrać grę w sposób indywidualanie efektywny, jeśli gracz B wybierze strategię b1 , natomiast,
iż wybierze zagra w sposób antagonistyczny, wybierając np. strategię a2 , jeśli gracz B wybierze
strategię b2 .
Tabela 3.4: Obawa gry w sposób antagonistyczny przez gracza B.
a1
a2
a3
a4
b1
[1, 1]
[1, 3]
[5, 5]
[6, 6]
b2
[1, 1]
[1, 3]
[5, 4]
[6, 5]
W tej sytuacji przekazanie informacji graczowi B na temat sposobu rozegrania gry przez
gracza A, ułatwia graczowi B przewidzenie tak zarówno sposobu rozegrania gry przez gracza B,
jak też konkretnej strategii, jaką wybierze i w ostateczności wyniku gry.
Groźba jako narzędzie realizacji celu indywidualnie efektywnego gracza A
Przykład 3.4 stanowił ilustrację sytuacji, giedy groźba gry w sposób antagonistyczny stanowiła
skuteczne narzędzie realizacji celu indywidualnie efektywnego, poprzez utrudnienie drugiemu
graczowi gry w sposób antagonistyczny. Groźba gry w sposób antagonistyczny jednakże może
stanowić skuteczne narzędzie nie tylko w w sensie powstrzymania drugiego gracza (tu gracza B)
przed rozgrywaniem gry w sposób antagonistyczny. Jest to również narzędzie skuteczne wówczas,
gdy rozgrywanie gry w sposób indywiudalnie efektywny przez jednego gracza (B), nie szłoby
w parze z najlepszą realizacją celu indywidualnie efektywnego przez drugiego gracza (A). W
istocie bowiem, nawet obustronne dążenie do indywidualnie efektywnego celu, nie musi bynajmniej oznaczać, iż rozgrywana gra pozbawiona jest jakichkolwiek napięć. O ile tylko gracze
dążą do uzyskania dwóch różnych wyników gry o tyle też będzie między nimi rywalizacja. W
59
dążeniu do uzyskania indywidualnie efektywnego celu zawiera się więc wielokrotnie konieczność
doprowadzenia do sytuacji, w której drugi gracz otrzyma wypłatę gorszą, niżby sobie tego życzył. Nie jest to jednakże równoznaczne z antagonizmem rozumianym jako stawianie sobie za cel
tej wypłaty pogorszenie. Dla przykładu, gracz B może otrzymać wypłatę gorszą, niż ta, którą
chciałby osiągnąć nie dlatego, że jest to bezpośrednim celem gracza A, ale dlatego, że maksymalizacja wypłaty gracza A nie musi iść w parze z maksymalizacją wypłaty gracza B. Innymi
słowy gra, w której gracze dążą do indywidualnie efektywnych celów w większości przypadków
nie będzie grą pozbawioną elementu współzawodnictwa. Co więcej, gracz wykonujący ruch jako
drugi (tu gracz A), może wysuwać groźby gry w sposób antagonistyczny, tylko po to, by w
najlepszy sposób zrealizować cel indywidualnie efektywny.
Przykład 3.5
Rozważmy grę z macierzą wypłat jak w tabeli 3.5. Załóżmy, że obaj gracze dążą do celu
indywidualnie efektywnego, co obu graczom jest wiadome. W tej sytuacji z punktu widzenia
indywidualnie efektywnego celu gracza B korzystnym jest wybranie strategii b2 . Rzecz jasna
indywidualnie efektywna odpowiedź gracza A (tu strategia a2 ) jest dla gracza B odpowiedzią
najbardziej korzystną. W tej sytuacji ustali się zapewne wynik [4, 3].
Tabela 3.5: Niepożądane z puntku widzenia gracza A dążenie gracza B do celu indywidualnie efektywnego.
a1
a2
b1
[3, 4]
[2, 0]
b2
[0, 2]
[4, 3]
Łatwo zauważyć, ze z punktu widzenia indywidualnie efektywnego celu gracza A korzystniej
byłoby doprowadzić do wyniku [3, 4]. W tej sytuacji wysunięcie groźby wybrania strategii a1 w
odpowiedzi na strategię b2 mogłoby się okazać posunięciem skutecznym, przymuszającym gracza
B do wyboru strategii b1 .
Istotnym jest tu owo rozróżnienie, iż w tym przypadku groźba gry w sposób antagonistyczny jest jedynie strategicznym posunięciem gracza A mającym na celu jak najlepszą realizację
celu indywidualnie efektywnego, nie zaś wyrazem rzeczywistego, antagonistycznego nastawienia
gracza A. Gdyby przewodnim był ów drugi motyw, wówczas rozsądniej byłoby dla gracza A nie
60
informować o tym gracza B. Więcej nawet, rozsądną byłaby deklaracja (rzecz jasna niewiarygodna) gry w sposób indywidualnie efektywny.
Korzyść z przekazania informacji na temat antagonistycznego celu gracza A
W odróżnieniu od sytuacji omawianej wyżej, kiedy to groźba gry w sposób antagonistyczny
stanowiła jedynie strategiczne posunięcie, mające na celu zapewnienie jak najlepszej realizacji
celu indywidualnie efektywnego, a co się z tym wiąże groźba ta dotyczyła jedynie określonej
(w ogólności określonych) strategii gracza B, możliwa jest również sytuacja, w której cel antagonistyczny stanowi dla gracza A cel podstawowy, który zamierza realizować niezależnie od
decyzji, jaką podejmie gracz B.
Na pierwszy rzut oka oczywistym wydaje się w tym momencie wniosek, iż nie jest w interesie
gracza A informowanie gracza B na temat celu, do jakiego zmierza. Gracz B po pierwsze może
utrudnić realizację tego celu, wybierając strategię inną, niżby wybrał mając świadomość, że gracz
A dążył będzie do celu indywidualnie efektywnego. Po drugie zaś, świadomość, że gracz A dąży
do celu antagonistycznego może stać się powodem do tego, by w oparciu o tę wiedzę opracować
własną antagonistyczną strategię, jako swoisty „uprzedzający odwet” za antagonizm gracza A.
W praktyce jednak okazuje się, że są sytuacje, w których poinformowanie o antagonistycznym
celu gracza A może być korzystne nie tylko dla gracza B (co oczywiste), który w ten sposób
może się jakoś zabezpieczyć, przed antagonizmem gracza A, ale również dla samego gracza A.
Przykład 3.6
Macierz wypłat w grze pojedynczej przedstawia się jak w tabeli 3.6. Gracz B zmierza do celu
indywidualnie efektywnego. Gracz A dąży do celu antagonistycznego zdefiniowanego jako chęć
utrzymania odległości pomiędzy wypłatami graczy równej 2. W przypadku niejednoznaczności,
gracz A wybiera tę strategię, która da mu lepszą wartość wypłaty.
Tabela 3.6: Przykład gry, w której korzystnym dla obu graczy jest poinformowanie
gracza B na temat antagonistycznego celu, do jakiego dąży gracz A.
a1
a2
b1
[1, 3]
[4, 5]
b2
[2, 4]
[1, 2]
Jeśli gracz B sądzi, że gracz A dąży do celu indywidualnie efektywnego, wówczas wybierze
61
strategię b1 , spodziewając się odpowiedzi a2 i wyniku [4, 5]. Gracz A wybierze jednak zgodną z
jego antagonistycznym celem strategię a1 , co da wynik [1, 3].
Co by się stało, gdyby gracz A poinformował gracza B na temat celu do jakiego dąży?
Oczywiście, jeśli gracz B dążyłby do celu indywidualnie efektywnego wybrałby strategię b2
spodziewając się odpowiedzi a1 , co dałoby wynik [2, 4] – lepszy dla obu graczy.
W powyższym przykładzie gracz zarówno gracz A jak i gracz B odnieśli korzyść z poinformowania gracza B odnośnie antagonistycznego celu, do jakiego dąży gracz A. Uzyskany w ten
sposób wynik jest lepszy dla obu graczy, niżby to było w przypadku nie przekazywania tej informacji. Stwierdzić jednak trzeba, że o ile w kontekście tak zdefiniowanego antagonistycznego celu,
wynik [2, 4] jest dla gracza A lepszy niż wynik [4, 5], to bynajmniej dla gracza B tak już nie jest.
Korzyść gracza B wynika jedynie z pozyskania iformacji na temat celu, nie zaś z samego faktu,
że ten cel jest antagonistyczny. Zajść jednak może przypadek, kiedy to sama antagonistyczność
celu gracza A okazać się może korzystna dla gracza B. Będzie tak wtedy, gdy również i gracz B
dążył będzie do celu antagonistycznego.
Indywidualnie efektywna korzyść gracza A z niewiarygodnej deklaracji gry w sposób
indywidualnie efektywny
Przykłady 3.4 oraz 3.5 ilustrowały sytuacje, w których z punktu widzenia indywidualnie efektywnego celu gracza A korzystnie było dla niego wysunąć groźbę, odstąpienia od tego celu na
rzecz celu antagonistycznego. Ta groźba przymuszała gracza B do wybrania strategii korzystniejszej dla gracza A z punktu widzenia jego indywidualnie efektywnego celu. W tym miejscu
przedstawimy przykład narzędzia wywierania bardziej subtelnej presji na gracza B, która przymusza go do rezygnacji ze strategii, którą wybrałby mając pewność, że gracz A grał będzie
w sposób indywidualnie efektywny. Tym narzędziem jest niewiarygodna obietnica gry w sposób
indywidualnie efektywny.
Przykład 3.7
Rozważmy przykład gry z macierzą wypłat jak w tabeli 3.7. Załóżmy, że gracz B dąży do
celu indywidualnie efektywnego. Jeśli gracz A deklarował będzie dążenie do indywidualnie efektywnego celu, wówczas w interesie gracza B jest wybór strategii b1 , co w rezultacie indywidualnie
efektywnej odpowiedzi gracza A – a2 doprowadzi do wyniku [3, 4].
Jeśli jednakże owa deklaracja wybrzmi jako niewiarygodna wówczas, z obawy przed antagonistyczną odpowiedzią a1 , gracz B może nie być skłonny do wyboru strategii b1 (co doprowadziłoby do wyniku [1, 3]). Wątpiąc w wiarygodność deklaracji gracza A, gracz B może być skłonny
62
Tabela 3.7: Korzystna niewiarygodność.
a1
a2
b1
[1, 3]
[3, 4]
b2
[2, 5]
[2, 1]
wybrać strategię bardziej dla siebie ostrożną – b2 . Jeśli mimo wszystko gracz A wybierze strategię a1 , wówczas osiągnie wynik lepszy (z punktu widzenia indywidualnie efektywnego celu –
[2, 5], aniżeli byłoby to w przypadku, gdyby gracz B wybrał strategię b1 .
Wynika stąd ogólny wniosek, iż niewiarygodność dążenia do indywidualnie efektywnego celu
może się okazać korzystna z punktu widzenia realizacji tego celu.
Rzecz jasna ten sam cel, gracz A uzyskać mógłby wysuwając przekonującą groźbę gry w
sposób antagonistyczny, której następnie, po wyborze przez gracza B strategii b2 by nie spełnił.
Składanie mało wiarygodnych deklaracji gry w sposób indywidualnie efektywny może być jednakże korzystniejsze z dyplomatycznego punktu widzenia aniżeli wysuwanie przekonujących
gróźb gry w sposób antagonistyczny. W pierwszym przypadku można być co najwyżej uznany za
posiadającego mało wiarygodne dobre pragnienia, w drugim ocena jest już dużo bardziej krytyczna. Mamy więc tu do czynienia z paradoksalnym i na swój sposób nieszczęsnym przypadkiem,
w którym bycie wiarygodnym nie popłaca.
Antagonistyczna korzyść gracza A z niewiarygodnej deklaracji gry w sposób indywidualnie efektywny
Idąc za przykładem sytuacji omówionej wyżej łatwo wysunąć przykład, w którym gracz A, dążąc
do realizacji celu antagonistycznego korzysta na tym, że gracz B wierzy w jego niewiarygodną
deklarację gry w sposób indywidualnie efektywny. Jeśli w ramach gry, jak w przykładzie 3.7
gracz A złoży deklarację gry w sposób indywidualnie efektywny, to może odnieść dużą korzyść
(zmierzając do np. maksymalnie antagonistycznego celu), jeśli gracz B w tę deklarację uwierzy,
wybierając strategię b1 .
Ogólne stwierdzenie jest więc takie, że w zależności od sytuacji, gracz A może odnieść korzyść,
rozumianą w sensie celu do jakiego zmierza, tak z faktu przekazania graczowi B wiarygodnych
jak i niewiarygodnych informacji na temat celu do jakiego dąży.
63
Kwestia wiarygodności deklaracji gry w określony sposób
Poza mimo wszystko wyjątkowymi przypadkami, kiedy to gracz A może odnieść korzyść z faktu
bycia niewiarygodnym (patrz przykład 3.7), odbieranie przez gracza B składanych przez gracza
A deklaracji gry w określony sposób jako deklaracji wiarygodnych, będzie dla gracza A w wielu
przypadkach korzystne. I będzie to korzystne tak zarówno wówczas, gdy ową deklarację zamierza wypełnić, jak też ją złamać6 . Dlatego też w takich przypadkach intencją gracza A będzie
czynienie owych deklaracji jak najbardziej wiarygodnymi.
Dla gracza B znajomość celu do jakiego dąży gracz A równoznaczna jest z możliwością
określenia konkretnej strategii ai , jaką gracz A wybierze w odpowiedzi na określoną strategię
bj . To pozwala w sposób dokładny przewidzieć, jaki ustali się wynik danej gry pojedynczej.
Wynik ten, przekształcony na wartość skalarną odzwierciedlającą cel, to którego zmierza gracz
B pozwala mu określić wartość, jaką ma dla niego każda z gier pojedynczych hl . A zatem
informacja o celu do jakiego dąży gracz A pozwala graczowi B dokonać oceny wartości każdej
z dostępnych w trakcie negocjacji strategii hl . W szczególności zaś, pozwala mu wskazać tę
strategię, o którą warto mu w trakcie negocjacji najbardziej zabiegać.
Analogiczna informacja dla gracza A nie jest wystarczająca, do określenia wartości poszczególnych strategii hl . Graczowi A nie wystarczy wiedzieć, do jakiego celu dąży gracz B, by wskazać
jednoznacznie strategię bj , jaką w trakcie rozgrywania gry pojedynczej gracz ten wybierze. Gracz
A musi nie tylko wiedzieć, do jakiego celu dąży gracz B, ale również musi mieć pewność, że gracz
B wie, do jakiego celu dąży gracz A. W tym sensie wyzwanie przed graczem A jest tu większe.
Graczowi B wystarczy poznać cel gracza A. Gracz A zaś musi poznać cel gracza B i przekonać
gracza B, że informacja, którą graczowi B przekazuje na temat własnego celu, jest informacją wiarygodną (i taką w rzeczywistości być może, choć nie musi). Co więcej, poinformowanie
drugiego gracza, na temat celu do jakiego dany gracz zamierza dążyć jest dla gracza B istotne jedynie na etapie rozgrywania gry podwójnej, co ułatwić może wybór określonej strategii hl (zgodę
gracza A na jej ustalenie). W przypadku gracza A jest to również istotne na etapie rozgrywania
gry pojedynczej, co ma zapewnić wybór pożądanej przez gracza A strategii bj .
Stąd też o ile deklaracje rozgrywania gry w określony sposób (dążenie do określonego celu)
gracz B może składać jedynie przed, lub w trakcie rozgrywania gry podwójnej (przed ustaleniem
strategii hl ), o tyle gracz A może to również czynić w trakcie rozgrywania gry pojedynczej (przed
6
Pomijamy w tym miejscu niezwykle istotny wątek moralny i kulturowo-twórczy (a może raczej dla owej
kultury destrukcyjny), związany z decyzją świadomego wprowadzania w błąd i składaniem deklaracji, których
dotrzymać się nie zamierza. Jest to oczywisty koszt niedotrzymywania złożonych deklaracji. Pomijamy rówież w
tym miejscu osłabienie ogólnej wiarygodności gracza A, na skutek złamanej deklaracji, jako oczywisty koszt (w
wielu przypadkach znacząco przewyższający jednorazową korzyść) podjętej decyzji, który z pewnością zaciąży na
dalszej współpracy graczy.
64
ustaleniem strategii bj ). Z tego też powodu gracz A może złożyć dwie, niekoniecznie jednakowe
deklaracje. Dla przykładu pierwsza, na etapie rozgrywania gry podwójnej może być deklaracają
gry w sposób indywidualnie efektywny (co może, choć nie musi zachęcić gracza B do ujawnienia
celu, do jakiego sam zamierza dążyć), druga – deklaracją (choćby warunkowa) gry w sposób
antagonistyczny.
Spójność składanych deklaracji wzmacnia ich wiarygodność. Z tego też powodu, druga ze
składanych przez gracza A deklaracji wybrzmi bardziej wiarygodnie wówczas, gdy będzie potwierdzeniem deklaracji pierwszej. Na wzmocnienie lub osłabienie wiarygodności deklaracji złożonej na
etapie rozgrywania gry pojedynczej wpłynie też niewątpliwie sam sposób prowadzenia negocjacji na etapie gry podwójnej. Ów sposób stanowić może również potwierdzenie lub zaprzeczenie
wiarygodności deklaracji złożonej przed czy w trakcie przeprowadzanych negocjacji. Rzecz jasna
zależności te nie muszą być ani jednoznaczne, ani tym bardziej łatwe do odczytania7 .
Zbieżność strategii antagonistycznych: zmiana znaczenia pojęcia „efektywność”
Cel do jakiego dążą gracze (indywidualnie efektywny lub antagonistyczny) jest wyrazem ich
stosunku do wypłaty własnej, jak też gracza drugiego. Wprowadzona w poprzednim rozdziale
skalarna miara oceny poszczególnych wyników gry umożliwia uszeregowanie tych wyników pod
względem ich wartości w kontekście owego celu. A zatem, jeśli nawet gracze są zainteresowani
rozgrywaniem gry w sposób antagonistyczny, to sukces w tej materii mierzą jedynie w oparciu o własną skalarną miarę oceny uzyskanego wyniku, nie mierzą jej bynajmniej w oparciu o
skalarną miarę oceny odzwierciedlającej cel drugiego gracza. Jest to spostrzeżenie o tyle istotne,
iż przynajmniej teoretycznie możliwa jest sytuacja, kiedy to nawet rozgrywając grę w sposób
wzajemnie antagonistyczny obaj gracze odniosą subiektywny „sukces”. Będzie tak wówczas,
kiedy ich antagonistyczne cele będą na swój sposób zbieżne.
Przykład 3.8
Rozważmy przykład gry z macierzą wypłat jak w tabeli 3.8.
Załóżmy, iż gracze kierują się następującymi strategiami antagonistycznymi:
• Gracz A: Dążenie do maksymalizacji własnej funkcji wypłaty, przy założeniu, że odległość
pomiędzy wypłatami graczy będzie wynosiła conajmniej 2.
• Gracz B: Dążenie do maksymalizacji własnej funkcji wypłaty, przy założeniu, że wypłata
gracza A będzie nie większa niż 4.
7
Pominiemy w tym miejscu rozwinięcie tego wątku.
65
Tabela 3.8: Zbieżność antagonizmów.
a1
a2
b1
[1, 3]
[3, 4]
b2
[2, 4]
[4, 5]
Jeśli w tej sytuacji gracz B sądził będzie, że gracz A dąży do celu indywidualnie efektywnego,
wówczas wybierze strategię b1 , spodziewając się wyniku [3, 4]. Niestety odpowiedzią gracza A
będzie strategią a1 , co doprowadzi do wyniku [1, 3]. Gdyby gracz B znał cel gracza A, wówczas
wybrałby strategię b2 , a ostateczny wynik [2, 4], byłby w sensie antagonistycznych celów graczy
najlepszym z możliwych do uzyskania w tej grze.
W powyższym przykładzie, w w interesie obu graczy było uzyskanie wyniku [2, 4], co odpowiadało wyborowi strategii b2 i a1 . Istotnym jest tu spostrzeżenie, że nie jest to bynajmniej
wynik efektywny z punktu widzenia indywidualnie rozważanych funkcji wypłaty obu graczy.
Mamy tu przypadek, kiedy to antagonistyczne podejście do gry zmienia subiektywne znaczenie
pojęcia „efektywność”. Można by wysunąć twierdzenie, iż ta zmiana znaczenia pojęcia efektywność poddaje w wątpliwość słuszność ewentualnej ingerencji regulatora, zmierzających do
uzyskania wyniku [4, 5] (np. poprzez przymuszenie gracza A do wyboru strategii a2 , jako dominującej w sensie indywidualnie efektywnego celu strategię a1 ). W istocie ingerencja regulatora
okazałaby się błędną, jeśli w korzyściach z uzyskanego wyniku partycypują jedynie gracze A
i B 8 . Błąd regulatora polegałby na nierozpatrzeniu wszystkich, istotnych dla graczy kryteriów
oceny wyniku gry, w szczególności kryteriów określających pożądany stosunek pomiędzy wartościami funkcji wypłaty poszczególnych graczy, a skupieniu się jedynie na jednym, polegającym
na dążeniu do uzyskania jak największej wartości własnej funkcji wypłaty.
Przyklad 3.8 pokazuje w sposób wymowny, iż zgodnie z wprowadzoną tu definicją strategii antagonistycznej nie jest ona w ogólności wyrazem chęci „pokrzyżowania planów” drugiemu graczowi, utrudnienia mu realizacji celu, jaki sobie zakłada. W tym sensie strategia antagonistyczna nie
jest strategią „złośliwą”. Jest raczej strategią „egoistyczną”, rozumianą jednakże w ten sposób,
że celem danego gracza staje się nie tylko uzyskanie jak najlepszej wartości własnej funkcji
wypłaty, ale również ustalenie określonego (pożądanego ze swego punktu widzenia) poziomu
wypłaty drugiego gracza. Jednym słowem celem danego gracza staje się nie tylko uzyskanie
8
Jeśli dla przykładu wynik [4, 5] okazałby się korzystniejszy od wyniku [2, 4] ze społecznego punktu widzenia,
wówczas ingerencja regulatora byłaby na mocy owej korzyści uzasadniona.
66
określonej wartości własnej funkcji wypłaty, ale również ukształtowanie odpowiedniego kontekstu dla tej wartości, ukształtowanie wartości wypłat innych graczy, z którymi wartość swojej
porównuje. Innymi słowy podstawową miarą sukcesu stają się nie tyle wartości bezwzględne ale
właśnie względne, wynikające z oceny jak własna wartość plasuje się na tle wartości uzyskanych
przez innego (innych) graczy.
Paradoksalnie nawet najbardziej antagonistyczna strategia (gracza A), polegająca na dążeniu w pierwszym rzędzie do minimalizacji wartości wypłaty drugiego gracza (B) może się okazać
strategią najbardziej korzystną dla tego (B) gracza, jeśli ten również kieruje się celem antagonistycznym.
Przykład 3.9
Tabela 3.9: Przykład gry, w której maksymalnie antagonistyczny cel gracza A jest
dla gracza B korzystny.
a1
a2
a3
a4
b1
[1, 2]
[2, 3]
[4, 3]
[3, 5]
b2
[2, 4]
[4, 5]
[3, 4]
[0, 1]
• Gracz A: Dążenie przede wszystkim do minimalizacji wartości wypłaty gracza B, a w
przypadku niejednoznaczności wybór tej strategii, która daje większą wypłatę graczowi A
(strategia maksymalnie antagonistyczna).
gracza A będzie nie większa niż 2.
Przy tak zdefinowanych celach, gracz B wybierze strategię b1 , co spotka się z odpowiedzią
a1 ze strony gracza A. W rezultacie ustali się wynik [1, 2], który dla gracza B jest w sensie jego
celu najlepszym z możliwych w tej grze. Nie jest to jednakże wynik najbardziej – w sensie jego
maksymalnie antagonistycznego celu – korzystny dla gracza A. Gracz A wolałby, aby ustalony
został wynik [0, 1], jako rezultat wyboru strategii b2 i a4 .
67
Jeszcze większy paradoks polega na tym, że strategia minimalnie antagonistyczna, polegająca
na dążeniu do maksymalizacji własnej funkcji wypłaty, a w przypadku niejednoznaczności, na
wyborze strategii dającej mniejszą wartość wypłaty drugiemu graczowi, może stać się narzędziem
najbardziej skutecznym, dla wyrażenia złośliwego podejścia do drugiego gracza.
Przykład 3.10
Tabela 3.10: Przykład gry, w której minimalnie antagonistyczny cel gracza A stanowić
może najbardziej skuteczne narzędzie utrudnienia graczowi B realizacji jego celu.
a1
a2
a3
a4
b1
[1, 3]
[2, 4]
[4, 5]
[0, 5]
b2
[2, 4]
[1, 3]
[0, 4]
[2, 4]
W tej sytuacji, niezależnie od celu, do jakiego zmierzał będzie gracz B (indywidualnie efektywnego lub antagonistycznego), realizacja celu minimalnie antagonistycznego gracza A (wybór
strategii a4 w odpowiedzi na strategię b1 lub strategii a3 w odpowiedzi na strategię b2 ) w maksymalnym stopniu utrudni graczowi B osiągniecie tego, co zamierzał.
W powyższym przykładzie minimalnie antagonistyczny cel gracza A w istocie wskazywał
na tę samą strategię ai , co cel maksymalnie antagonistyczny. W szczególnych przypadkach,
gdy taka zależność nie zachodzi, minimalnie antagonistyczna strategia gracza A może mimo to
najskuteczniej utrudnić realiację celu graczowi B.
Przykład 3.11
• Gracz A: Dążenie przede wszystkim do maksymalizacji wartości własnej funkcji wypłaty, a
w przypadku niejednoznaczności wybór tej strategii, która daje mniejszą wypłatę graczowi
B (strategia minimalnie antagonistyczna).
gracza A będzie conajmniej o 2 mniejsza niż wsypłata gracza B.
68
Tabela 3.11: Przykład gry, w której minimalnie antagonistyczny cel gracza A stanowić
może najbardziej skuteczne narzędzie utrudnienia graczowi B realizacji jego celu.
Cel maksymalnie i minimalnie antagonistyczny gracza A nie wskazują na tę samą
strategię ai .
a1
a2
a3
a4
b1
[2, 0]
[4, 2]
[5, 4]
[6, 4]
b2
[3, 1]
[4, 1]
[5, 3]
[6, 5]
W tej sytuacji w odpowiedzi na strategię b1 gracz A wybierze strategię a3 , co doprowadzi
do wyniku [5, 4], natomiast w odpowiedzi na strategie b2 , gracz A wybierze strategię b4 , co
doprowadzi do wyniku [6, 5]. Mimo minimalnie antagonistycznego celu gracza A, uzyskany przez
gracza B wynik będzie najgorszy z możliwych, niezależnie od tego, czy wybierze strategię b1 , czy
b2 . Paradoks polega tu na tym, że wynik dla gracza B byłby lepszy (w sensie celu, do którego
dąży) nawet wówczas, gdyby gracz A kierował się strategią maksymalnie antagonistyczną.
Korzystna dla gracza B groźba ze strony gracza A
Powyższe przykłady ilustrują, że nieznajomość celu, do jakiego dąży gracz B nie daje graczowi A
gwarancji, że przykładowo wysunięta przez niego groźba (czy też mało wiarygodna deklaracja gry
w sposób indywidualnie efektywny) okaże się skuteczna. Może się bowiem okazać, iż w interesie
gracza B będzie tej groźby spełnienie (jeśli ten będzie chciał grać w sposób antagonistyczny), a
wysunięta przez gracza A groźba wyboru określonej strategii ai , jako odpowiedź na daną strategię
bj będzie w istocie tym, co gracz B chciałby osiągnąć. Nieznajomość celu do jakiego dąży gracz
B w ogólności osłabia, a w szczególnych przypadkach całkowicie niweluje siłę wysuwanych przez
gracza A gróźb (i ewentualnych obietnic). Jednakże nawet tego, czy tak się w istocie dzieje gracz
A nie jest w stanie sprawdzić, dopóki nie zna celu do jakiego dąży gracz B.
Istnieje w tym również pewne niebezpieczeństwo dla gracza A. Wysunięcie przez niego groźby
wyboru określonej strategii ai może w istocie zachęcić gracza B do wyboru takiej strategii, której
wybrać się obawiał, a która w połączeniu z realizacjią groźby najlepiej zrealizuje antagonistyczny
cel gracza B.
Przykład 3.12
69
Tabela 3.12: Przykład gry, w której gracza B korzystna na fakcie, iż gracz A wysunął
wobec niego groźbę.
a1
a2
a3
b1
[5, 4]
[5, 7]
[5, 4]
b2
[3, 6]
[2, 4]
[2, 3]
Załóżmy, iż gracz B kieruje się strategią antagonistyczną, opartą na dążeniu, by gracz A nie
otrzymał wypłaty większej niż 4, a jednocześnie, zapewnieniu sobie wypłaty nie mniejszej niż o
2-wie jednostki od wypłaty gracza A.
Wobec tak zdefiniowanego celu, trzy wyniki mogą ustatysfakcjonować gracza B: [5, 4] dla
strategii b1 i a1 lub a3 , [2, 4] dla strategii b2 i a2 oraz [2, 3] dla strategii b2 i a3 .
Jeśli cel gracza A oparty będzie przynajmniej w jakiejś mierze na dążeniu do maksymalizacji
własnej funkcji wypłaty, wóczas należy stwierdzić, że wynik [5, 4] nie jest możliwy do uzyskania. Gracz A będzie bowiem preferował nad niego wynik [5, 7], który w przypadku wyboru przez
gracza B strategii b1 będzie dostępny dla gracza A poprzez wybór strategii a2 . Gracz B nie powienien też oczekiwać wyniku [2, 3] bowiem nad niego (niezeleżnie od celu – jeśli tylko pozostanie
racjonalny – gracza A) z pewnością preferowany będzie wynik [2, 4]. Gracz B przypuszcza, że
gracz A kierował się będzie przede wszystkim maksymalizacją własnej funkcji wypłaty, a zatem
w odpowiedzi na strategię b1 , gracz A odpowie strategią a2 , co doprowadzi do wyniku [5, 7],
natomiast w odpowiedzią na b2 będzie prawdopodobnie strategia b1 , co doprowadzi do wyniku
[3, 6]. Wynik [3, 6] nie dość, że przekracza pożądaną przez gracza B wartość wypłaty gracza A,
to na dodatek nie zapewnia pożądanego stosunku pomiędzy wypłatami graczy, który w tym
przypadku wynosi 3. Wobec tego przyjmijmy, że gracz B preferuje wynik [5, 7] nad wynik [3, 6].
Licząc się z tym, że wynik [2, 4] będzie raczej niemożliwy do osiągnięcia (z racji na przewidywaną
preferencję gracza A wskazującą raczej na wynik [3, 6]), gracz B skłonny będzie wybrać strategię
b1 .
Załóżmy, że gracz A faktycznie dąży w pierwszej kolejności do maksymalizacji własnej
fukcji wypłaty. Przy czym wartość 7, jest dla niego radykalnie korzystniejsza, aniżeli wartość
6. W istocie, uzyskanie wartości 7, stanowi swoistą wartość progową, którą gracz A zmuszony
jest przekroczyć. Podstawowy koszt, wynikający z otrzymania ewentualnej wartości mniejszej
związany jest dla gracza A nie tyle z odległością wartości otrzymanej od pożądanej wartości 7,
ile z zamym faktem jej nie osiągnięcia.
Gracz A nie wie jednak, do jakiego celu dążdy gracz B, a spodziewając się, że będzie to cel
70
antagonistyczny dopuszcza, że gracz B może wybrać strategię b2 . Chcąc tego za wszelką cenę
uniknąć, gracz A wysuwa groźbę, którą z pełną determinacją zamierza spełnić, jeśli zajdzie ku
temu okazja, iż w przypadku wyboru przez gracza B strategii b2 , wybierze strategię a2 .
Paradoksalnie właśnie ta groźba i związana z nią wiarygodność jej spełnienia stają się
bezpośrednią przyczyną wyboru przez gracza B strategii b2 .
Rzecz jasna przedstawione wyżej przykłady traktować należy raczej jako szczególne przypadki, nie zaś zasadę samą w sobie i w ogólności należy się raczej spodziewać, iż im bardziej
antagonistycznym celem kierował się będzie dany gracz, tym będzie to z większą szkodą dla
drugiego gracza. W szczególności zaś będzie tak zawsze, gdy gracz, przeciwko któremu stosowana
jest strategia antagonistyczna, dąży do celu indywidualnie efektywnego (gdy swój sukces mierzy
w kategoriach wartości własnej funkcji wypłaty).
Wybór strategii hl w grze podwójnej w sytuacji nieznajomości celu, go jakiego dąży
gracz B
Powyższe przykłady pokazują ograniczoną skuteczność wysuwanych gróźb, jak też niebezpieczeństwa związane z przekazaniem przez gracza A informacji graczowi B, na temat celu do jakiego
zmierza, w przypadku, gdy cel gracza B nie jest graczowi A znany. Z punktu widzenia rozgrywania gry podwójnej przed graczem A stoi podwójne wyzwanie: pozyskanie ifnormacji na temat celu
gracza B i ewentualne przekazanie mu informacji na temat własnego celu. Tym zagadnieniem
zajmiemy się w następnym punkcie. W tym miejscu zaproponowane zostanę metody określania
wartości poszczególnych gier pojedynczych, hl , a poprzez to wskazanie najbardziej pożądanych
w trakcie negocjacji strategii hl . Rzecz jasna, z racji na nieznajomosć celu gracza B, każda z
przedstawionych metod skazana jest na konieczność dokonywania arbitralnych wyborów, a ostateczny wynik gry, może nie mieć dużo wspólnego z przewidywanym. Mimo to wybór, jakiego w
trakcie przeprowadzanych w ramach gry podwójnej negocjacji dokona gracz A nie będzie przypadkowy, lecz będzie wynikiem określonego, precyzyjnego rozumowania i w tym sensie, może on
zostać uznany za racjonalny. Poniżej ilustrujemy cztery możliwe podejścia, jakie gracz A może
tu zastosować9 .
• Potraktowanie każdej z gier pojedynczych jako gry przeciwko naturze
max
• Założenie, że gracz B wybierze strategię z minimalną wartością ΥA
jl
• Określenie prawdopodobieńst wyboru określonych strategii bj
9
Rzecz jasna możliwych podejść może być więcej.
71
• Założenie indywidualnie efektywnego celu obu graczy
Potraktowanie każdej z gier pojedynczych jako gry przeciwko naturze
W tym podejściu, gracz A ignoruje wszelkie informacje zawarte w macierzy wypłat gracza
B, mogące ewentualnie pomóc we wskazaniu, którą ze strategii bj gracz B mógłby wybrać.
Wybór określonej strategii bj traktowana jest tu jako wynik przypadku. Informacja o wartościach
wypłaty gracza B wykorzystywana jest jedynie do określenia wartości (w sensie celu do jakiego
A zmierza), jaką dla gracza A przedstawia określony wynik gry.
Procedura postępowania przebiega tu w sposób następujący:
Metoda:
1. Przekształcenie oryginalnej macierzy wypłat graczy w macierz skalarnych wartości poszczególnych wyników, odzwierciedlających cel gracza A.
2. Przekształcenie macierzy skalarnych wartości w macierz gry przeciwko naturze.
3. Określenie wartości poszczególnych gier hl w oparciu o określone kryterium wyboru strategii
w grze przeciwko naturze.
Przykład 3.13
Załóżmy, że macierz wypłat w grze podwójnej przedstawia się jak w tabeli 3.13. Załóżmy,
że gracz A dąży do celu indywidualnie efektywnego, dążąc do wyboru strategii, która da mu
największą wartość wypłaty. Gracz A nie zna celu, do jakiego dąży gracz B. Gracz A postanawia
więc potraktować gracza B jako naturę.
Tabela 3.13: Macierz wypłat w grze podwójnej.
h1
h2
a1
a2
a3
b1
[2, 3]
[3, 1]
[1, 4]
b2
[2, 2]
[5, 3]
b3
[3, 2]
[3, 4]
h3
a1
a2
a3
a1
a2
a3
b1
[1, 2]
[2, 3]
[3, 2]
b1
[2, 5]
[3, 4]
[4, 3]
[3, 5]
b2
[5, 2]
[4, 3]
[4, 4]
b2
[1, 1]
[2, 5]
[2, 5]
[4, 2]
b3
[2, 3]
[3, 2]
[2, 3]
b3
[3, 3]
[3, 2]
[2, 3]
72
1. Przekształcenie oryginalnej macierzy wypłat graczy w macierz skalarnych wartości
poszczególnych wyników, odzwierciedlających cel gracza A.
Gracz A kieruje się celem indywidualnie efektywnym. Przyjmiemy więc, że wartość poszczególnych wyników [V A , V B ] określał będzie zgodnie z poniższą formułą.
V A [V A , V B ] = V A .
(3.8)
W oparciu o zależność (3.8) przekształcić możemy oryginalną macierz wypłat graczy, do
postaci macierzy 3.14.
Tabela 3.14: Macierz skalarnych wartości poszczególnych wyników gry, odzwieciedlających indywidualnie efektywny cel gracza A.
h1
h2
a1
a2
a3
b1
3
1
4
b2
2
3
b3
2
4
h3
a1
a2
a3
a1
a2
a3
b1
2
3
2
b1
5
4
3
5
b2
2
3
4
b2
1
5
5
2
b3
3
2
3
b3
3
2
3
2. Przekształcenie macierzy skalarnych wartości w macierz gry przeciwko naturze.
Dla utworzenia z macierzy skalarnych wartości poszczególlnych wyników gry, macierzy gry
przeciwko naturze gracz A musi jednoznacznie określić strategię, jaką wybierze w odpowiedzi na
poszczególne strategie bj , ustalając w ten sposób odpowiadającą im wartość skalarną, a co się z
tym wiąże. Ponieważ im większa wartość skalarnej miary wyniku, tym wynik ten jest dla gracza
A większy, zatem dla każdej strategii bj gracz A wybierze tę strategię, która da mu największą
A (a ).
wartość Vhj
i
A , dla których
Elementami macierzy wypłat w grze przeciwko naturze będą takie wartości Vhj
zachodzi:
A
A
Vhj
= max Vhj
(ai ).
i
(3.9)
Jej strategiami zaś, strategie hl , traktowane tu jako strategia gracza A i strategie bj , traktowane
jako strategie natury.
Stąd, przekształcając zgodnie z zależnością (3.9) otrzymujemy macierz wypłat w grze przeciwko naturze postaci 3.15.
73
Tabela 3.15: Macierz wypłat w grze przeciwko naturze, uzyskana z macierzy
skalarnych wartości poszczególnych wyników gry.
b1
b2
b3
h1
4
5
4
h2
3
4
3
h3
5
5
3
3. Określenie wartości poszczególnych gier hl w oparciu o określone kryterium wyboru strategii
w grze przeciwko naturze.
Mając problem sformułowany w postaci gry przeciwko naturze, do jego rozwiązania gracz A
może zastosować narzędzia analizy właściwe dla tego typu gier [3, 6, 7, 10, 13, 22]. W szczególności zastosować może określone kryterium wyboru strategii w grze przeciwko naturze. Jeśli dla
przykładu gracz A kierował się będzie kryterium Walda, postaci:
max{min VjA (hl ) : l ∈ IH },
j
(3.10)
wówczas w negocjacjach powienien dążyć do wyboru strategii h1 . Odpowiadająca jej gra pojedyncza h1 ma bowiem dla gracza A największą wartość w sensie kryterium Walda – równą 4, co
odpowiada największej z najmniejszych wartości z poszczególnych wierszy macierzy 3.15 równej
4.
Jeśli kierował się będzie kryterium Laplace’a postaci:
X
VjA (hl ) : l ∈ IH },
(3.11)
max{max VjA (hl ) : l ∈ IH },
(3.12)
max{
j
lub kryterium optymistycznym postaci
j
wówczas równorzędnie ze strategią h1 może rozważać strategię h3 .
max
Założenie, że gracz B wybierze strategię z minimalną wartością ΥA
jl
74
Zakłada się tu, że gracz B wybierze tę strategię, dla której maksymalny współczynnik do
max
antagonistycznej odpowiedzi gracza A – ΥA
przyjmuje wartość najmniejszą. Przy tym pojl
dejściu zakłada się, że gracz B nie znając celu do jakiego dąży gracz A zakłada, że ten grał
będzie w sposób antagonistyczny. Rzecz jasna gracz A w sposób prosty może do takiej sytuacji
doprowadzić, przekazując graczowi B taką właśnie informację. Przy takim podejściu gracz, do
określenia wartości poszczególnych strategii hl gracz A może zastosować następującą metodę.
Metoda:
1. Określenie dla każdej z gier hl strategii bj , dla której maksymalny współczynnik do antagonistycznej odpowiedzi gracza A przyjmuje wartość najmniejszą.
2. Określenie skalarnej miary oceny wyniku uzyskanego w rezultacie wyboru strategii bj wyznaczonych w poprzednim ponkcie i strategii ai odpowiadającej rzeczywistemu celowi, do
jakiego zmierza gracz A.
3. Wybór strategii hl , dla której wartość skalarnej miary oceny odpowiadającego jej wyniku
przyjmuje wartość największą.
Przykład 3.14
h1
h2
a1
a2
a3
b1
[2, 3]
[3, 1]
[1, 4]
b2
[2, 2]
[5, 3]
b3
[3, 2]
[3, 4]
h3
a1
a2
a3
a1
a2
a3
b1
[1, 2]
[2, 3]
[3, 2]
b1
[2, 5]
[3, 4]
[4, 3]
[3, 5]
b2
[5, 2]
[4, 3]
[4, 4]
b2
[1, 1]
[2, 5]
[2, 5]
[4, 2]
b3
[2, 3]
[3, 2]
[2, 3]
b3
[3, 3]
[3, 2]
[2, 3]
1. Określenie dla każdej z gier hl strategii bj , dla której maksymalny współczynnik do
antagonistycznej odpowiedzi gracza A przyjmuje wartość najmniejszą.
75
Dla uproszczenia przyjmiemy, że gracz A zakłada10 , że gracz B przyjmuje za miarę zachęty
do odpowiedzi w sposób antagonistyczny następującą zależność:
max
ΥA
=
jl
n
o
n
o,
max VjlBmax − VjlBmin , (3.13)
max VjlAmax − VjlAmin przy czym VjlBmax oraz VjlAmax są wartościami wypłat odpowiednio gracza B i gracza A w sytuacji,
gdy gracz A dąży do celu minimalnie antagonistycznego:
n
o
ăk (bj ) = arg lex max VjA (ai ), −ViB (bj ) ,
i
(3.14)
natomiast VjlBmin i VjlAmin wartościami odpowiadającymi wyborowi strategii ai w maksymalny
sposób antagonistycznej
n
o
ăk (bj ) = arg lex min ViB (bj ), −VjA (ai ) .
i
(3.15)
Dla macierzy wypłat jak w tabeli 3.13 otrzymujemy:
max
ΥA
= 1.
11
max
ΥA
= 1.
12
max
ΥA
= 1.
13
max
ΥA
= 1/3.
21
max
= 1.
ΥA
22
max
ΥA
= 1/4.
23
max
ΥA
= 1.
31
max
ΥA
= 1.
32
max
ΥA
= 1.
33
Z powyższych zależności wynika, że w grze h1 gracz B wybierze strategię b2 i w grze h3
strategię b2 . Niejednoznaczna jest strategia gracza B w grze h2 . Wynika to z faktu, że dla każdej
strategii bj wartość współczynnika zachęty do maksymalnie antagonistycznej odpowiedzi gracza
A jest jednakowa i wynosi 1.
10
Tego typu arbitralności nie są możliwe do uniknięcia.
76
W takich przypadkach, dla jednoznacznego wyłonienia strategii bj , gracz A musi zastosować
dodaktowe kryterium, którym – jak przypuszcza będzie się kierował gracz B. Jednym z takich
kryteriów może być np. dążenie gracza B do wyboru takiej strategii bj , która da mu większą wartość wypłaty11 V B . Rzecz jasna muszą one odpowiadać maksymalnie antagonistyznej
odpowiedzi gracza A.
Przy takim założeniu, w grze h2 gracz B powinien wybrać strategię b2 , co zapewni mu
wypłatę równą 4.
2. Określenie skalarnej miary oceny wyniku uzyskanego w rezultacie wyboru strategii bj
wyznaczonych w poprzednim ponkcie i strategii ai odpowiadającej rzeczywistemu celowi, do
jakiego zmierza gracz A.
Załóżmy dla uproszczenia, iż gracz A w rzeczywistości zmierza do celu indywidualnie efektywnego, a zatem każdy z wyników ocenia zgodnie z poniższą zależnością:
V A [V A , V B ] = V A .
(3.16)
Stąd też gracz A wybierał będzie taką strategię ai , która zapewni mu największą z możliwych
wartości wypłaty V(A jl)(ai ). Stąd w grze h1 , w odpowiedzi na strategię b2 gracz A wybierze
strategię a3 , co doprowadzi do wyniku [3, 5]; w grze h2 , w odpowiedzi na strategię b2 gracz A
wybierze strategię a3 , co doprowadzi do wyniku [4, 4]; w grze h3 w odpowiedzi na strategię b2
gracz A wybierze strategię a2 lub a3 , co doprowadzi do wyniku [2, 5].
3. Wybór strategii hl , dla której wartość skalarnej miary oceny odpowiadającego jej wyniku
przyjmuje wartość największą.
Wobec powyższego gra h1 ma dla gracza A wartość równą 5, gra h2 wartość równą 4 i gra h3
wartość równą 5. A zatem w trakcie negocjacji gracz A powinien zabiegać w pierwszej kolejności
o wybór strategii h1 lub h3 .
Określenie prawdopodobieńst wyboru określonych strategii bj
11
Jest to w istocie założenie, że gracz B dążył będzie nie tylko do wyboru takiej strategii bj , dla której
współczynnik do maksymalnie antagonistycznej odpowiedzi będzie jak najmniejszy, ale równocześnie, że gracz B
dąży do celu indywidualnie efektywnego.
77
Podejście to łączy w sobie zarówno podejście oparte na założeniu, że gracz B traktowany jest
jako natura, jak tez podejście oparte na założeniu, że gracz B dąży do wyboru takiej strategii bj ,
dla której jest minimalne wartość zachęty do antagonistycznej odpowiedzi gracza A. W podejściu
traktującym strategie gracza B jak strategie natury, gracz A ignorował wszelkie iformacje na
temat macierzy wypłat gracza B, zakładając, że praktycznie każda ze strategii bj może zostać
wybrana, co więcej zakładał, że strategie te mogą być wybrane z jednakowym prawdopodobieństwem. W podejściu opierającym się na minimalizacji maksymalnej zachęty do odpowiedzi
antagonistycznej, gracz A wskazywał jednoznacznie na strategię bj , którą w danej grze, jego
zdaniem gracz B wybierze.
W omawianym w tym punkcie podejściu zakładamy, że gracz B wybrać może każdą ze
strategii bj (analogia do gry przeciwko naturze), jednakże z prawdopodobieństwem odzwierciedlajacym wartość wypłaty jaką gracz B otrzyma wówczas, gdy gracz A wybierze w odpowiedzi
strategię najbardziej antagonistyczną.
Przyjmiemy, że dana strategia bj w danej grze hl będzie dla gracza B tym mniej atrakcyjna,
im większa będzie suma wartości VjlBmin , czyli wartości wypłaty, jaką otrzyma gracz B wówczas,
gdy gracz A w swojej odpowiedzi kieruje się celem maksymalnie antagonistycznym (w pierwszej
kolejności minimalizuje wypłatę gracza B, a w przypadku niejednoznaczności maksymalizuje
wypłatę własną) oraz VjlBmax , czyli wartości wypłaty, jaką otrzyma gracz B wówczas, gdy gracz
A w swojej odpowiedzi kieruje się celem minimalnie antagonistycznym (w pierwszej kolejności
maksymalizuje włąsną wypłatę, a w przypadku niejednoznaczności minimalizuje wypłątę gracza
B). A zatem prawdopodobieństwo wyboru określonej strategii bj w grze pojedynczej hl wyrazimy
następującą zależnością:
plj
VjlBmin + VjlBmax
=P
k
VklBmin + VklBmax
.
(3.17)
Uwzględniając te prawdopodobieństwa, jak również planowane odpowiedzi ai gracza A na
każdą ze strategii bj , określić można wartość oczekiwaną wypłat graczy dla każdej z gier pojedynczych hl zgodnie z zależnościami:
E(VlA ) =
X
plj · VjlA (ai ),
(3.18)
plj · VilB (bj ).
(3.19)
j
E(VlB ) =
X
j
W ten sposób grę hl opisać można poprzez wynik [E(VlA ), E(VlB )], będący w istocie wartością
oczekiwaną z wyników odpowiadających poszczególnym strategiom bj . Następnie dokonać można
skalaryzacji tego wyniku w sposób odzwierciedlający cele do jakiego dąży gracz A.
V A [E(VlA ), E(VlB )] .
(3.20)
78
Skalaryzacja ta (w sposób analogiczny jak to było dotychczas) określać będzie wartość jaką dany
wynik (rozumiany w sensie wartości oczekiwanych z wypłat graczy) ma dla gracza A (w sensie
celu, do jakiego zmierza). Wartość skalarnej miary (3.20) określa wartość jaką odpowiadająca
jej gra pojedyncza ma dla gracza A. W trakcie negocjacji gracz A powinien dążyć do wyboru
tej strategii hl , której odpowiada gra pojedyncza hl o największej wartości.
Procedura przebiega więc w sposób następujący:
Metoda:
1. Określenie prawdopodobieństw wyboru określonych strategii bj w każdej grze pojedynczej hl
zgodnie z zależnością (3.17).
2. Określenie odpowiedzi gracza A (strategii ai ) na każdą ze strategii bj w każdej grze pojedynczej hl .
3. Określenie wartości oczekiwanej wyniku danej gry pojedynczej hl w oparciu o prawdopodobieństwa wyboru określonych strategii bj oraz odpowiedzi gracza A – ai , zgodnie z zależnościami
(3.18) i (3.19).
4. Określenie wartości skalarnej miary oceny oczekiwanego wyniku gry pojedynczej hl .
5. Wybór strategii hl , dla której wartość skalarnej miary oceny odpowiadającego jej oczekiwanego wyniku przyjmuje wartość największą.
Przykład 3.15
h1
h2
a1
a2
a3
b1
[2, 3]
[3, 1]
[1, 4]
b2
[2, 2]
[5, 3]
b3
[3, 2]
[3, 4]
h3
a1
a2
a3
a1
a2
a3
b1
[1, 2]
[2, 3]
[3, 2]
b1
[2, 5]
[3, 4]
[4, 3]
[3, 5]
b2
[5, 2]
[4, 3]
[4, 4]
b2
[1, 1]
[2, 5]
[2, 5]
[4, 2]
b3
[2, 3]
[3, 2]
[2, 3]
b3
[3, 3]
[3, 2]
[2, 3]
79
1. Określenie prawdopodobieństw wyboru określonych strategii bj w każdej grze pojedynczej hl
zgodnie z zależnością (3.17).
Dla określenia prawdopodobieństw wyboru określonych strategii bj w poszczególnych grach
pojedynczych hl wyznaczymy najpierw określimy najpierw wartości maksymalnych zachęt do
max
odpowiedzi antagonistycznych gracza A – ΥA
.
jl
• Gra h1
Bmin
Bmax
Dla strategii b1 otrzymujemy: V11
= 1, V11
= 1.
Bmin
Bmax
= 2, V21
= 3.
Bmin
Bmax
= 3.
= 3, V31
Stąd otrzymujemy:
p11 =
1+1
= 2/13.
1+1+2+3+3+3
2+3
p12 =
= 5/13.
13
3+3
p13 =
= 6/13.
13
• Gra h2
Bmin
Bmax
= 2.
= 1, V12
Bmin
Bmax
= 4, V22
= 4.
Bmin
Bmax
= 2, V32
= 2.
Stąd otrzymujemy:
p21 =
1+2
= 3/15.
1+2+4+4+2+2
4+4
= 8/15.
p22 =
15
2+2
p23 =
= 4/15.
15
• Gra h3
Bmin
Bmax
= 2, V13
= 2.
Bmin
Bmax
= 1, V23
= 2.
Bmin
Bmax
= 2, V33
= 2.
Stąd otrzymujemy:
p31 =
2+2
= 4/11.
2+2+1+2+2+2
80
1+2
= 3/11.
11
2+2
= 4/11.
p33 =
11
p32 =
2. Określenie odpowiedzi gracza A (strategii ai ) na każdą ze strategii bj w każdej grze
pojedynczej hl .
Załóżmy, że gracz A kieruje się celem indywidualnie efektywnym, a zatem:
• W grze h1
W odpowiedzi na strategię b1 gracz A wybierze strategię a3 . W efekcie ustali się wynik
[1, 4].
[3, 5].
[3, 4].
• W grze h2
[2, 3].
[4, 4].
[2, 3].
• W grze h3
[2, 5].
[2, 5].
[3, 3].
81
3. Określenie wartości oczekiwanej wyniku danej gry pojedynczej hl w oparciu o
prawdopodobieństwa wyboru określonych strategii bj oraz odpowiedzi gracza A – ai , zgodnie z
zależnościami (3.18) i (3.19).
W oparciu o dotychczasowe wyniki otrzymujemy:
E(V1A ) = 2/13 · 4 + 5/13 · 5 + 6/13 · 4 = 8/13 + 25/13 + 24/13 = 57/13 = 4.38
E(V2A ) = 3/15 · 3 + 8/15 · 4 + 4/15 · 3 = 9/15 + 32/15 + 12/15 = 53/15 = 3.53
E(V3A ) = 4/11 · 5 + 31 · 5 + 4/11 · 3 = 20/11 + 15/11 + 12/11 = 47/11 = 4.27
E(V1B ) = 2/13 · 1 + 5/13 · 3 + 6/13 · 3 = 2/13 + 15/13 + 18/13 = 35/13 = 2.69
E(V2B ) = 3/15 · 2 + 8/15 · 4 + 4/15 · 2 = 6/15 + 32/15 + 8/15 = 46/15 = 3.07
E(V3B ) = 4/11 · 2 + 31 · 2 + 4/11 · 3 = 8/11 + 6/11 + 7/11 = 21/11 = 1.91
4. Określenie wartości skalarnej miary oceny oczekiwanego wyniku gry pojedynczej hl .
Opierając się na założeniu, że gracz A dąży do celu indywidualnie efektywnego, przyjmiemy następującą postać skalarnej miary oceny oczekiwanego wyniku poszczególnych gier pojedynczych:
V A [E(VlA ), E(VlB )] = E(VlA ).
(3.21)
Stąd :
V A [E(V1A ), E(V1B )] = E(V1A ) = 4.38
V A [E(V2A ), E(V2B )] = E(V2A ) = 3.53
V A [E(V3A ), E(V3B )] = E(V3A ) = 4.27
5. Wybór strategii hl , dla której wartość skalarnej miary oceny odpowiadającego jej
oczekiwanego wyniku przyjmuje wartość największą.
Wobec otrzymanych wartości skalarnych miar oceny oczekiwanych wyników gry w trakcie
negocjacji gracz A powinien dążyć do wyboru strategii h1 .
Założenie indywidualnie efektywnego celu obu graczy
82
W tym podejściu zakłada się, że gracz B zmierza do celu indywidualnie efektywnego, będąc
przekonanym, że gracz A również do niego dąży. Również do tej sytuacji gracz A może doprowadzić przekazując graczowi B informację, iż taki właśnie cel sobie wyznacza. Przyjęcie,
że gracz B dążył będzie w tej sytuacji do celu indywidualnie efektywnego podeprzeć można
rozumowaniem, że gdyby mimo wszystko, gracz B chciał dążyć do celu antagonistycznego, to
mogłoby to zostać odczytane przez gracza A jako prowokacja do gry w ten sposób.
Przy takim założeniu, w każdej z gier pojedynczych gracz B powinien wybrać taką strategię
bj (oznaczmy ją przez b̂), która zapewni graczowi B możliwie największą wypłatę V B , przy
założeniu, że odpowiedzią gracza A będzie taka strategia â(bj ), dla której wartość wypłaty
gracza A – V A będzie największa. Powyższe rozumowanie prowadzi do określenia strategii â(bj )
zgodnie z poniższą zależnością:
â(bj ) = arg max VjA (ai ) : ∀j,
i
(3.22)
Oznaczmy indeks strategii â(bj ) przez î. Wartość wypłaty gracza B w sytuacji, gdy wybrał
on swoją strategię bj , zaś gracz A w odpowiedzi wybrał najlepszą dla siebie strategię â(bj ),
oznaczymy przez VîB (bj ). Stąd gracz A może się spodziewać, że w danej grze pojedynczej hl
gracz B wybierze taką strategię b̂ dla której zachodzi następująca zależność:
b̂ = arg max VîB (bj ).
j
(3.23)
Mając ustaloną strategię b̂ gracz A może określić wynik każdej z gier pojedynczych jako
rezultat wyboru strategii b̂ i ostatecznej odpowiedzi gracza A – strategii ai , która w najlepszym
sensie odzwierciedlać będzie cel, do którego dąży gracz A (cel ten może, choć nie koniecznie musi
odzwierciedlać przyjęty na etapie wyznaczania strategii b̂ cel indywidualnie efektywny). Wartość
danej gry pojedynczej hl określona będzie przez wartość skalarnej miary oceny, odzwierciedlającej cel, do jakiego dąży gracz A, wyniku uzyskanego w rezultacie wyboru strategii b̂ i ai . W
ostateczności w trakcie negocjacji gracz A powinien zabiegać o wybór w pierwszej kolejności tej
strategii hl , dla której odpowiadająca jej gra pojedyncza hl ma dla gracza A wartość największą
(w sensie skalarnej miary oceny przewidywanego wyniku, odzwierciedlającej jego cel).
O ostateczności przebieg procesu decyzyjnego opisać można w następujących krokach:
Metoda:
1. W oparciu o zależności (3.23) i (3.22) określenie strategii b̂, strategii jaką zgodnie z przewidywaniami gracza A wybierze gracz A na etapie gry pojedynczej.
83
2. Określenie oczekiwanego wyniku każdej z gier pojedynczych hl – [VĵlA (ai ), VilB (b̂)], jako rezultat wyboru strategii b̂ przez gracza B oraz strategii ai , w najlepszym stopniu odzwierciedlającej cel, do jakiego dąży gracz A.
3. Stworzenie skalarnej miary oceny VlA [VĵlA (ai ), VilB (b̂)]
oczekiwanych wyników każdej z
gier pojedynczych hl , która odzwierciedlała będzie cel do jakiego dąży gracz A. Wartość tej
miary dla danej gry hl określa wartość tej gry.
4. Dążenie do wyboru w trakcie negocjacji tej strategii hl (oznaczmy przez ĥ), dla której
odpowiadająca jej gra pojedyncza posiada największą wartość.
ĥ = arg max VlA [VĵlA (ai ), VilB (b̂)] .
(3.24)
l
Przykład 3.16
h1
h2
a1
a2
a3
b1
[2, 3]
[3, 1]
[1, 4]
b2
[2, 2]
[5, 3]
b3
[3, 2]
[3, 4]
h3
a1
a2
a3
a1
a2
a3
b1
[1, 2]
[2, 3]
[3, 2]
b1
[2, 5]
[3, 4]
[4, 3]
[3, 5]
b2
[5, 2]
[4, 3]
[4, 4]
b2
[1, 1]
[2, 5]
[2, 5]
[4, 2]
b3
[2, 3]
[3, 2]
[2, 3]
b3
[3, 3]
[3, 2]
[2, 3]
1. W oparciu o zależności (3.23) i (3.22) określenie strategii b̂, strategii jaką zgodnie z
przewidywaniami gracza A wybierze gracz A na etapie gry pojedynczej.
Prześledźmy sposób rozumowania gracza B przy założeniu, że dąży on do celu indywidualnie
efektywnego i spodziewa się indywidualnie efektywnej odpowiedzi gracza A.
• Gra h1
Jeśli gracz B wybrałby strategię b1 , wówczas odpowiedzią gracza A byłaby strategia a3 i
ustaliłby się wynik [1, 4]. Jeśli gracz B wybrałby strategię b2 , wówczas odpowiedzią gracza
84
A byłaby strategia a3 i ustaliłby się wynik [3, 5]. Jeśli gracz B wybrałby strategię b3 ,
wówczas odpowiedzią gracza A byłaby strategia a2 i ustaliłby się wynik [3, 4].
Wobec powyższego w grze h1 gracz B wybierze strategię b2 12 .
• Gra h2
A byłaby strategia a3 i ustaliłby się wynik [4, 4]. Jeśli gracz B wybrałby strategię b3 ,
wówczas odpowiedzią gracza A byłaby strategia a1 lub a3 i ustaliłby się wynik [2, 3].
Wobec powyższego w grze h2 gracz B wybierze strategię b2 .
• Gra h3
A byłaby strategia a2 lub a3 i ustaliłby się wynik [2, 5]. Jeśli gracz B wybrałby strategię
b3 , wówczas odpowiedzią gracza A byłaby strategia a1 lub a3 i ustaliłby się wynik [3, 3]
lub [2, 3]13 .
Którą ze strategii wybierze tu gracz B? Wybór strategii b3 daje z jednej strony graczowi B
nadzieję, że gracz A odpowie indywidualnie efektywną strategią a1 , co doprowadziłoby do
korzystnego dla gracza B wyniku [3, 3]. Taka odpowiedź jest jednakże mało prawdopodobna i to nie tylko dlatego, że gracz A będzie miał dostępną tak samo dla siebie dobrą (z
punktu indywidualnie efektywnego celu) strategię a3 , ale również dlatego, że wybór strategii b3 może zostać przez niego potraktowany jako antagonistyczne posunięcie ze strony
gracza B. W istocie bowiem wybór strategii b1 lub b2 , dawałby graczowi B taką samą
wartość wypłaty, jak w przypadku wyboru strategii b3 i odpowiedzi a3 . Mimo wszystko
gracz B nie musi się tu obawiać antagonizmu gracza A. Wszystko, co w przypadku wyboru
strategii b3 może zrobić gracz A, to wybrać strategię a3 , doprowadzając w ten sposób do
12
Strategia b3 dawałaby graczowi B taką samą wartość wypłaty, jednakże gorszą graczowi A. Przy uwzględ-
nieniu przyjętych tu założeń należy oczekiwać, że gracz B obawiał się będzie wyboru strategii b3 (minimalnie
antagonistycznej), bowiem ta mogłaby zostać odebrana przez gracza A jako prowokacja do równie, albo jeszcze
bardziej antagonistycznej odpowiedzi, co z punktu indywidualnie efektywnego celu gracza B nie byłoby korzystne.
13
Z racji na fakt, że gracz A wykonuje ruch jako drugi, to nie musi się obawiać wyboru strategii minimalnie
antagonistycznej a3 , co da mu taki sam wynik jak w przypadku strategii a1 , natomiast gorszy dla gracza B.
85
wyniku [2, 3], co i tak może się graczowi B wydać rozwiązaniem bardziej atrakcyjnym14 ,
niż doprowadzenie do wyniku [2, 5], jakby to było w przypadku wyboru strategii b1 lub b2 .
Ostateczna decyzja gracza B nie jest tu więc oczywista. Gracze we wzajemnym porozumieniu mogą dojść do określenia, który z wyników zostanie ustalony [2, 5], [2, 3] czy może
[3, 3]. Ogromną rolę w dokonywaniu tego wyboru odgrywać mogą przewidywane stosunki
w przyszłości.
Dla uproszczenia analizy przyjmimy jednakże, iż gracz A przyjmuje wersję najbardziej
pesymistyczną oczekując wyboru strategii b3 .
Podsumowując, otrzymamy:
b̂1 = b2 .
b̂2 = b2 .
b̂2 = b3 .
2. Określenie oczekiwanego wyniku każdej z gier pojedynczych hl – [VĵlA (ai ), VilB (b̂)], jako
rezultat wyboru strategii b̂ przez gracza B oraz strategii ai , w najlepszym stopniu
odzwierciedlającej cel, do jakiego dąży gracz A.
Przyjmimy, iż gracz A rzeczywiście dąży do celu indywidualnie efektywnego. Wobec tego w
grze h1 , gracz A na strategię b2 odpowie strategią a3 , co da wynik [V1A , V1B )] = [3, 5], w grze h2 ,
gracz A na strategię b2 odpowie strategią a3 , co da wynik [V2A , V2B )] = [4, 4], w grze h3 , gracz A
na strategię b3 odpowie strategią a1 , co da wynik [V3A , V3B )] = [3, 3].
3. Stworzenie skalarnej miary oceny VlA [VĵlA (ai ), VilB (b̂)] oczekiwanych wyników każdej z gier
pojedynczych hl , która odzwierciedlała będzie cel do jakiego dąży gracz A. Wartość tej miary dla
danej gry hl określa wartość tej gry.
Przyjmiemy, iż gracz A, w świetle indywidualnie efektywnego celu, do którego dąży, oceniał będzie poszczególne wyniki, a poprzez to określał będzie wartość poszczególnych gier pojedynczych zgodnie z poniższą formułą.
V A [V A , V B ] = V A .
Stąd gra h1 ma dla gracza A wartość V A [3, 5]
(3.25)
= 5, gra h2 ma dla gracza B wartość
V A [4, 4] = 4, gra h3 ma dla gracza B wartość V A [3, 3] = 3.
14
Pamiętać należy, iż dążenie do celu indywidualnie efektywnego przez gracza B może być podyktowane jedynie
obawą przed antagonistyczną odpowiedzią gracza A, w rzeczywistości zaś gracz B może szykać nie kosztownych
dla siebie sposobów osłabienia wyniku osiąganego przez gracza A.
86
4. Dążenie do wyboru w trakcie negocjacji tej strategii hl (oznaczmy przez ĥ), dla której
odpowiadająca jej gra pojedyncza posiada największą wartość.
W trakcie negocjacji gracz A powinien zatem dążyć do wyboru strategii ĥ = h1 .
Przedstawione wyżej metody podejścia do problemu wyboru strategii hl , w sytuacji nieznajomości celu, do jakiego dąży gracz B, a więc:
max
jl
traktować można jako wzajemne uzupełnienie. W szczególności, jeśli określona metoda wskazuje
niejednoznacznie na dwie strategie hl , wówczas do wyłonienia jednej z nich gracz A może zastosować inną metodę. Gracz A może również przyjąć, że zdecyduje się na wybór tej strategii,
na którą wskaże najwięcej z powyższych metod. W istocie każda z metod pozwoli na uszeregowanie poszczególnych strategii hl , wskazując na strategie w jej sensie najbardziej pożądane,
aż do strategii najmniej pożądanych. Opierając swój wybór na kilku metodach gracz A będzie
w istocie musiał dokonać agregacji ocen otrzymanych z poszczególnych metod. Sam zaś proces
agregacji traktować można jako stworzenie nowej medoty oceny wartości poszczególnych strategii
hl 15 .
Wymiana informacji na temat celu graczy
Z punktu widzenia gry pojedynczej przed graczem A, zaś z punktu widzenia gry podwójnej przed
oba graczami stoi więc wyzwanie, czy przekazywać sobie wzajemnie informację na temat celu,
do jakiego gracze zmierzają, czy też raczej zachować tę informację dla siebie. W szczególnych
przypadkach przekazanie tej informacji może stanowić swoiste „powiększenie ciastka” [2, 14, 16,
18], zanim gracze poprzez wybór konkretnych strategii dokonają pomiędzy siebie jego podziału.
Problem dla danego gracza polega jednak na tym, że w owym „większym ciastku” przypaść mu
może mniejsza część, niż pierwotnie [19]. Rzecz jasna gracze nigdy nie stracą na tym, że poznają
cel drugiego gracza. Stąd też w interesie graczy będzie próba pozyskania informacji na temat
15
Agregacja wielokryterialnych ocen wielu wariantów jest problemem analogicznym do próby wyłaniania naj-
lepszego z pośród wielu wariantów w drodze głosowania, w którym udział bierze wielu członków (wiele kryteriów
oceny) [12, 14, 20].
87
celu, do jakiego drugi gracz zmierza. Źródłem straty może być jedynie przekazanie drugiemu
graczowi informacji na temat celu, do jakiego samemu się zmierza. Jednakże, jak to zostało
wykazane w przykładzie 3.6 to samo przekazanie informacji może stanowić dla gracza źródło
zysku.
Rozważając problem z punktu widzenia gracza A istotną więc jest odpowiedź na dwa pytania:
1. Jakiego zysku można się spodziewać z pozyskania informacji na temat celu, do jakiego
będzie dążył gracz B (w szczególności z pozyskania informacji na temat strategii jaką
wybierze)?
2. Jakiego zysku/straty można się spodziewać z przekazania graczowi B informacji na temat
celu, do jakiego dąży gracz A?
Odpowiedź na pytanie pierwsze pozwala oszacować maksymalny koszt, jaki opłaca się ponieść
na pozyskanie informacji o celu gracza B. Odpowiedź na pytanie drugie pozwala oszacować
minimalna cenę, za którą opłacałoby się informację o własnym celu graczowi B sprzedać. Rzecz
jasna oba problemy są ze sobą powiązane. Jeśli gracz B nie zna celu do jakiego dąży gracz A, to
pozyskanie przez gracza A informacji na temat celu, do jakiego dąży gracz B może nie przynieść
wiele korzyści w kwestii określenia, która ze strategii bj zostanie przez gracza B wybrana. Jeśli
gracz B znał będzie cel do jakiego dąży gracz A, wówczas graczowi wystarczy dowiedzieć się
do jakiego celu dążył będzie gracz B, a określenie konkretnej strategii bj będzie już można
wywnioskować.
Poznanie celu, do jakiego dąży gracz B, nawet w sytuacji, gdy gracz B nie zna celu do jakiego
dąży gracz A jest o tyle dla gracza A korzystne, że umożliwia mu to odpowiednie „sterowanie”
decyzją gracza B poprzez wysuwanie deklaracji gry w określony sposób, w tym składanie obietnic i wysuwanie gróźb, w kontekście danej strategii bj gracza B. Należy się jednak liczyć z
tym, że próba wpływania na decyzję gracza B (w szczególności poprzez wysuwanie gróźb) może
spowodować zmianę celu, do jakiego dążył będzie gracz B. Innymi słowy, gracz A próbując
sterować decyzją gracza B poprzez selektywne przekazywanie informacji na temat planowanych
własnych odpowiedzi na określone strategie gracza B w istocie oddaje możliwość wyboru wyniku
gry w ręce gracza B. Jeśli tylko składane deklaracje określonych odpowiedzi ai (bj ) będą wiarygodne, wówczas gracz B może sam zadecydować, jaki ustalić wynik gry, poprzez wybór określonej
strategii bj , na którą gracz A zobowiązał się odpowiedzieć strategię ai (bj ). W istocie bowiem cel
do jakiego zamierzał dążyć gracz B mógłbyć uwarunkowany głównie niepewnością związaną z
potencjalną odpowiedzią (a więc i celem) gracza A. Poznanie tych odpowiedzi uwalnia gracza B
z tych uwarunkowań tak, że może on już swobodniej kształtować cel, do którego chce zmierzać,
mając odwagę wyboru określonych strategii bj , na które już z góry zna odpowiedź gracza A.
88
A zatem przed graczem A stoi jeszcze jeden problem: stabilność celu gracza B w kontekście
wysuwanych gróźb i obietnic ze strony gracza A.
Aby określić wartość informacji na temat celu do jakiego dąży gracz B należałoby dokonać
dwóch kalkulacji: kalkulacji wyniku jakiego spodziewa się gracz A w przypadku nieznajomości celu gracza B oraz kalkulacji wyniku, jaki przypuszczalnie ustalić by się miał w sytuacji
znajomości tegoż celu. Moduł różnicy wartości skalarnych miar wartości tych wyników, odzwierciedlających cel gracza A przyjąć by można wówczas za definicję wartości informacji dotyczącej
celu gracza B. W sensie formalnym brzmi to prosto, w praktyce jednak prostota dotyczy jedynie
owego brzmienia16 .
Dwie z wyżej opisanych metod wyboru strategii hl w kontekście nieznajomości celu, do
jakiego dążył będzie gracz B:
max
jl
w istocie sprowadzają się do założenia, że gracz B w swojej decyzji kierował się będzie określonym, znanym dla gracza A celem, co więcej zakłada znajomość określonej strategii bj , jaką
w danej grze pojedynczej hl gracz B wybierze. Aby oszacować wynik, jaki ustali się wówczas,
gdy gracz A rzeczywiście pozna cel gracza B, po to, by określić wartość pozyskanej informacji,
należałoby uprzednio przyjąć znajomość tego celu. Przy założeniu, że w sytuacji nieznajomości celu gracza B gracz A decyduje się na wybór jednej z powyższych metod, trudno znaleźć
uzasadnienie, dlaczego do szacowania wyniku określonego przez rzeczywisty cel gracza B do
jego wyznaczenia zakłada się cel inny, niż założony w powyższych metodach. Gdyby tak być
miało, należałoby w punkcie wyjścia – w momencie kształtowania metody wyboru strategii hl
w sytuacji nieznajomości celu gracza B – założyć, że ten cel jest właśnie taki, jak to się następnie zamierza przyjąć w momencie szacowania wyniku, odpowiadającego rzeczywistemu celowi.
Sama więc koncepcja zdaje się nie wytrzymywać krytyki na gruncie teoretycznym.
Analogicznie rzecz by się miała w przypadku, gdy do wyboru strategii hl w kontekście nieznajomości celu, do jakiego dąży gracz B, przyjmie się którąś z pozostałych metod:
16
Przeprowadzany w tym miejscu wywód jest próbą nawiązania do koncepcji operatora najbardziej obiecu-
jącego, wykorzystanej do oszacowania zysku z pozyskania informacji na temat macierzy wypłat gracza konkurencyjnego w grach przeciwko naturze [6, 8, 10].
89
W przypadku wyboru metody, w której każdą z gier pojedynczych traktuje się, jako swoistą
grę przeciwko naturze, w istocie postanawia się przyjąć, iż każda ze strategii bj jest tak samo
możliwa do wyboru przez gracza B (jednakowe prawdopodobieństwo). Skoro taka metoda została
wybrana do oszacowania wartości danej gry pojedynczej, to trudno jest znaleźć uzasadnienie,
dlaczego do oszacowania tej wartości w przypadku znajomości rzeczywistego celu gracza B
przyjąć metodę inną. Jeśli próbując oszacować a priori wartość informacji dotyczącej celu gracza
B postanawia się przyjąć okreśoną strategię bj (ewentualnie ich zbiór), jako odzwierciedlającą
ten cel, to niniejszym stwierdza się, że wszystkie strategie bj nie są tak samo prawdopodobne,
a więc przyjęta metoda szacowania wartości gry pojedynczej musiałaby się okazać w punkcie
wyjścia błędna.
Podobnie rzecz się mieć będzie w przypadku metody polegającej na określeniu prawdopodobieńst
wyboru określonych strategii bj . Jeśli na etapie szacowania wartości gry pojedynczej przy założeniu znanego a priori celu gracza B przyjąć inne wartości prawdopodobieńst (choćby przez
wskazanie konkretnej strategii bj , którą gracz B miałby wybrać) tym samym podważa się
słuszność pierwotnie przyjętych wartości prawdopodobieńst.
Wobec powyższego należy stwierdzić, że próba określenie korzyści z pozyskania informacji
na temat rzeczywistego celu gracza B, czyli próba przekształcenia omawianej w tym rozdziale
gry z nieznanym celem w omawianą w rozdziale poprzedniem grę ze znanym celem gracza B,
musi prowadzić nieuchronnie albo do stwierdzenia braku korzyści z pozyskania takiej informacji
(zarówno w przypadku nieznajomości celu jak i w przypadku jego znajomości gracz A wskazywałby albo na tę samą strategię bj , jaką gracz B miałby wybrać, albo na ten sam rozkład prawdopodobieństwa wyboru poszczególnych strategii bj ), albo do podważenia słuszności przyjętej
metody szacowania wartości gry pojedynczej, co po jej skorygowaniu prowadziłoby i tak do
stwierdzenia, że pozyskanie informacji nie niesie żadnej korzyści.
Jeśli więc tylko w powyższym rozumowaniu nie ma błędu, to musimy stwierdzić, iż gracz A
nie jest w stanie oszacować a priori wartości informacji na temat celu do jakiego zmierzał będzie
gracz B.
Do rozważenia pozostaje więc jeszcze problem ewentualnej korzyści lub straty z przekazania
graczowi B informacji na temat własnego celu. Jak to stwierdzono wcześniej takie posunięcie
może być sensowne z punktu widzenia gracza A jedynie wówczas, gdy sam zna już cel do jakiego
dąży gracz B. Jak to ilustrowały omawiane wyżej przykłady (od 3.4 do 3.8) wielkość korzyści
zależna jest tak zarówno od celu do jakiego dąży gracz B, jak też od samej struktury macierzy
wypłat. Wielkość ewentualnej korzyści lub straty, przy założeniu znajomości celu gracza B gracz
A może w tym wypadku określić w sposób jednoznaczny, jeśli pewnym będzie, że gracz B swego
celu nie zmieni oraz za wiarygodną (czy też niewiarygodną, jak to ilustrowano w przykładzie 3.7)
90
uzna deklarację gry w określony sposób przez gracza A. Rzecz jasna, jeśli przekazanie informacji
graczowi B na temat rzeczywistego celu gracza A miałoby być dla gracza niekorzystne, wówczas
w jego interesie jest zachowanie tego celu w tajemnicy, a może jeszcze bardziej przekazanie
informacji o celu nieprawdziwym, który jeśli zostanie przez gracza B uznany za prawdziwy,
może doprowadzić do najlepszej realizacji prawdziwego celu gracza A (przykład tego omówiony
został w punkcie dotyczącym antagonistycznej korzyści gracza A z niewiarygodnej deklaracji
gry w sposób indywidualnie efektywny).
3.2
Pierwszym ruchem w grze podwójnej jest proces ustalania
cen na rynku detalicznym gracza A
Przypadek, w którym w grze podwójnej pierwszym ruchem jest proces ustalania cen na rynku
detalicznym gracza A jest o tyle dla tego gracza trudnym, że na drodze do określenia wartości poszczególnych gier pojedynczych ai , uzyskanych w rezultacie wyboru w grze podwójnej
określonej strategii ai , gracz A napotyka dwa źródła niepewności:
1. Niepewność odnośnie strategii bj na rynku detalicznym gracza B
2. Niepewność odnośnie strategii hl , jako wynik negocjacji cen na rynku hurtowym (ruch
hipotetycznego gracza H)
Obie niepewności wynikają z nieznajomości celu do jakiego dąży gracz B.
Do rozwiązania problemu decyzyjnego z punktu widzenia gry podwójnej – wyboru takiej
strategii ai , która doprowadzi do najkorzystniejszej z punktu widzenia gracza A gry pojedynczej
– gracz A może zastosować jedno z poniższych podejść.
Założenie, że w trakcie negocjacji H zostanie wybrana strategia rekomendowana przez regulatora
Jest to podejście najprostsze, umożliwiające graczowi A wyeliminowanie niepewności związanej
z wyborem w trakcie negocjacji określonej strateii hl . Gracz A zakłada tu, iż w trakcie odbywających się w grze pojedynczej negocjacji H zostanie wybrana strategia rekomendowana przez
regulatora h∗ . Przy takim założeniu z punktu widzenia gry podwójnej gracz A może analizować
przypadek AHB tak samo jak omawiany we wcześniejszym punkcie tego rozdziału przypadek
HAB, zaś przypadek ABH tak samo jak przypadek HBA. Wymaga to jedynie założenia, że
w grze pojedynczej gracz A ma tylko jedną dostępną strategię ai , która odpowiada założonej
strategii h∗ .
91
Założenie określonego celu gracza B
Jest to w istocie próba przekształcenia problemu decyzyjnego gracza A do przypadku omawianego w poprzednim rozdziale, w którym założono znajomość celu do jakiego dąży gracz B.
W istocie rzeczy, w wielu przypadkach może się to okazać nie aż takie trudne. W szczególności
spodziewać się można, iż największe zainteresowanie gracza B wzbudzać będzie cel indywidualnie
efektywny lub minimalnie antagonistyczny. Podpowiedzią dla gracza A w tym względzie mogą
być wartości maksymalnych współczynników antagonistycznej zachęty do wyboru określonej
strategii. Jeśli będą one nie duże, to gra w sposób antagonistyczny może się okazać dla gracza
B zbyt kosztowna, a więc dobrym przybliżeniem będzie założenie, że gracz ten w sposób antagonistyczny grać się nie zdecyduje.
92
Rozdział 4
Możliwość kształtowania kolejności
ruchów w grze podwójnej
Przedstawiony w dwóch poprzednich rozdziałach problem decyzyjny gracza A sprowadał się
do kwestii wyboru określonej strategii gry w grze podwójnej. Zakładaliśmy tam istotnie, że to
właśnie gracz A wykonuje ruch w grze podwójnej. Tak ukształtowana sytuacja decyzyjna jest
jednak w rzeczywistości wynikiem dokonania uprzedniego wyboru: podjęcia decyzji wykonywania w całej grze ruchu jako pierwszy. Ponadto zakładano, że również w grze pojedynczej kolejność
ruchów graczy jest ustalona.
Dopuszczając możliwość kształtowania przez graczy kolejności ruchów w grze podwójnej
(jak też w grze pojedynczej) stawiamy graczy przed podwójnym problemem: raz, problemem
oszacowania wartości poszczególnych uszeregowań ruchów graczy, w szczególności wskazania uszeregowania dla danego gracza najbardziej korzystnego, dwa, problemem wdrożenia najbardziej
pożądanej kolejności. W niniejszym rozdziale nasza uwaga zostanie skupiona na problemie pierwszym, problemie oszacowania wartości poszczególnych uszeregowań ruchów graczy. Problem
wdrożenia najbardziej pożądanej dla danego gracza kolejności ruchów traktować należy przede
wszystkim jako problem praktyczny, którego teoretyczna analiza wybiega poza zakres niniejszego
pracy.
A zatem z punktu widzenia gry podwójnej stawiamy przed graczem A (jak również przed
graczem B) problem wskazania najbardziej pożądanej z jego punktu widzenia kolejności ruchów.
W szczególności pytamy, czy opłaca się graczowi A jako pierwszemu ustalać ceny na własnym
rynku detalicznym (proces A) czy może raczej poczekać, aż ceny te ustali gracz B, lub też
hipotetyczny gracz H, którego strategie odzwierciedlają możliwe wyniki procesu negocjacji cen
na rynku hurtowym.
Wartość danego uszeregowania dla gracza A (jak też dla gracza B) określić można poprzez
93
94
ROZDZIAŁ 4. MOŻLIWOŚĆ KSZTAŁTOWANIA KOLEJNOŚCI RUCHÓW W GRZE PODWÓJNEJ
wynik, jakiego w wyniku całej gry (podwójnej i pojedynczej) gracze mogą się spodziewać (czy
to w sensie dosłownym, czy też w sensie probabilistycznym, w sensie wartości oczekiwanej).
Przed graczami stoi więc problem oszacowania wartości poszczególnych gier pojedycznych, do
jaki dojść może w rezultacie wyboru określonej strategii w grze podwójnej. Gracze więc pytają
o wartość każdego z sześciu uszeregowań: ABH, AHB, HBA, HAB, BAH oraz BHA.
Należy zauważyć, że przynajmniej w sensie teoretycznym decyzja danego gracza odnośnie
pożądanej kolejności ruchów nie może się ograniczać do wskazania, kto z punktu widzenia jego
korzyści powinien wykonać ruch jako pierwszy w grze podwójnej. Istotna bowiem może się okazać
również kolejność ruchów w grze pojedynczej.
Oznaczmy przez V A (AHB) wartość, jaką dla gracza A ma uszeregowanie AHB. Jeśli możliwą
jest sytuacja, że:
V A (AHB) > V A (HAB) > V A (ABH) > V A (HBA)
to widać wyraźnie, iż gracz A nie może jednoznacznie stwierdzić, że korzystniej dla niego jest
ustalić w grze podwójnej ceny na rynku detalicznym, aniżeli ceny na rynku hurtowym. To
bowiem, który z ruchów będzie bardziej preferowany w trakcie rozgrywania gry podwójnej zależne jest od tego, jaka będzie kolejność ruchów w grze pojedynczej. Stąd też rodzi się wniosek,
iż zabiegając o to, by dany gracz wykonał ruch jako pierwszy w grze podwójnej, gracz A (jak
również gracz B) musi rozważać, że istnieje szansa, że uda mu się również w grze pojedynczej
ukształtować pożądaną kolejność ruchów.
Omowione w dwóch poprzednich rozdziałach metody umożliwiają graczowi A oszacowanie
wartości czterech z pośród sześciu uszeregowań: ABH, AHB, HBA, HAB. Są to uszeregowania,
w których zakładaliśmy, że gracz A wykonuje w grze podwójnej ruch jako pierwszy (czy to
w sensie niezależnej decyzji odnośnie własnych cen na rynku detalicznym, czy też w sensie
możliwości wpływania na wynik procesu negocjacji cen na rynku hurtowym). Uszeregowania
BAH i BHA uznane zostały z punktu widzenia gracza A za gry pojedyncze, bowiem faktycznie
udział w grze dla gracza A rozpoczyna się tutaj dopiero po niezależnej decyzji gracza B. Dążąc
do wskazania optymalnej kolejności ruchów gracz A musi w jakiś sposób ocenić wartość również
i tych uszeregowań.
Aby tego dokonać gracz A musi określić, którą strategię bj (ewentualne które ze strategii) w
grze podwójnej gracz B może wybrać, jak również określić wartość ukształtowanej w ten sposób
gry pojedynczej bj . Wybór określonej strategii bj zależna jest od tego, jaką wartość dla gracza B
posiada gra pojedyncza bj . Rozwiązanie tego problemu jest dość proste w przypadku, gdy gracz
A zna cel do jakiego dąży gracz B. W tym przypadku gracz A może potraktowąć przypadek
BHA tak jak omawiany w rozdziale 2 przypadek AHB, zaś przypadek BAH jak przypadek ABH
wcielając się w ten sposób w pierwotnych przypadkach (BHA i BAH) w rolę gracza B, traktując
95
jego macierz wypłat jako własną, zaś własną jako jego. W zależności od tego, czy w pierwotnym
problemie (BHA i BAH) gracz B znał cel gracza A czy nie, w problemie przekształconym (AHB
i ABH) gracz A powinien założyć, że zna lub nie cel gracza B.
Zilustrujemy to na poniższym przykładzie.
Przykład 4.1
Załóżmy, że gracz A chce oszacować wartość uszeregowania BHA. Macierz wypłat w grze
przedstawia się jak w tabeli 4.1.
Tabela 4.1: Macierz wypłat w grze pierwotnej.
b1
b2
a1
a2
a3
h1
[2, 3]
[3, 1]
[1, 4]
h2
[2, 2]
[5, 3]
h3
[3, 2]
[3, 4]
b3
a1
a2
a3
a1
a2
a3
b1
[1, 2]
[2, 3]
[3, 2]
b1
[2, 5]
[3, 4]
[4, 3]
[3, 5]
b2
[5, 2]
[4, 3]
[4, 4]
b2
[1, 1]
[2, 5]
[2, 5]
[4, 2]
b3
[2, 3]
[3, 2]
[2, 3]
b3
[3, 3]
[3, 2]
[2, 3]
Aby określić wartość tego uszeregowania V A (BHA) gracz A musi określić przewidywany
wynik całej gry (choćby w sensie wartości oczekiwanej wyniku) – [V A , V B ]. Załóżmy, że gracz
A zna cel do jakiego dąży gracz B. Gracz B jednakże nie zna celu, do jakiego dąży gracz A.
Dla oszacowania wyniku tej gry, gracz A przekształca ten przypadek w przypadek AHB, z
założeniem, że w tym nowym przypadku gracz A nie zna już celu gracza B 1 . Macierz wypłat w
grze przekształcownej przedstawia się jak w tabelii 4.2.
Tabela 4.2: Macierz wypłat w grze przekształconej.
a1
1
a2
b1
b2
b3
h1
[2, 3]
[3, 1]
[1, 4]
h2
[2, 2]
[5, 3]
h3
[3, 2]
[3, 4]
a3
b1
b2
b3
b1
b2
b3
h1
[1, 2]
[2, 3]
[3, 2]
h1
[2, 5]
[3, 4]
[4, 3]
[3, 5]
h2
[5, 2]
[4, 3]
[4, 4]
h2
[1, 1]
[2, 5]
[2, 5]
[4, 2]
h3
[2, 3]
[3, 2]
[2, 3]
h3
[3, 3]
[3, 2]
[2, 3]
Wynika to z faktu, że w przypadku pierwotnym gracza B nie znał celu graca A.
96
ROZDZIAŁ 4. MOŻLIWOŚĆ KSZTAŁTOWANIA KOLEJNOŚCI RUCHÓW W GRZE PODWÓJNEJ
Przypadek ten analizować już możemy w oparciu o narzędzia przedstawione w rozdziale
3, dotyczące przypadku gdy w grze podwójnej pierwszym ruchem jest ustalenie cen na rynku
detalicznym gracza A.
Aby określić wartość danego uszeregowania gracz A dokonuje skalaryzacji uzyskanego wyniku.
Należy zwrócić uwagę, że owa skalaryzacja dokonywać się winna na wartości wypłaty z macierzy
pierwotnej, nie zaś przekształconej. Innymi słowy, jeśli w macierzy przekształconej ukształtował
się wynik [V A = 2, V B = 3], to w macierzy pierwotnej oznacza on [V B = 2, V A = 3] i ten wynik
należy ostatecznie poddawać ocenie.
W przypadku, gdy gracz A nie zna celu do jakiego dążył będzie gracz B, wówczas nie jest w
stanie przewidzieć, którą ze strategii bj gracz ten wybierze w trakcie rozgrywania gry podwójnej.
W tej sytuacji jednym z możliwych sposobów, pozwalającym graczowi A oszacować wartość uszeregowania, w którym pierwszym ruchem jest proces B, będzie potraktowanie decyzji gracza B,
jako decyzji natury. Wartość poszczególnych gier pojedynczych bj może gracz A oszacować w
sposób jednoznaczny, jeśli przyjmie, że w trakcie przeprowadzanych w grze pojedynczej negocjacji zostanie wybrana strategia h∗ lub probabilistyczny, jeśli dopuści wybór innej strategii hl .
Wynik całej gry (gry podwójnej) określony więc zostanie poprzez dobór odpowiedniego kryterium wyboru strategii w grze przeciwko naturze, agregującego wartości poszczególnych gier
pojedynczych w sposób odzwierciedlający stosunek gracza A do niepewności związanej z decyzją
gracza B.
Zakończenie
W ramach zakończenia podsumowane zostaną podstawowe rezultaty pracy oraz nakreślone
kierunki dalszych badań. Rezultaty pracy są następujące:
• Dokonano analizy zależności pomiędzy ustaloną a pożądaną kolejnością ruchów w grze pojedynczej. Analizowano problem, czy korzystnie dla danego gracza jest dokonywać takiego
wyboru w grze podwójnej, który przy ustalonej kolejności ruchóww grze pojedynczej ukształtuje macierz wypłat tej gry jako gry z preferencją kolejności ruchów odpowiadającej
kolejności ustalonej. W oparciu o różne przypadki szczególne wykazano, że może zachodzić
sytuacja, w której korzystnie dla danego gracza będzie ukształtować daną grę pojedynczą
jako grę z preferencją kolejności ruchów niezgodnej z kolejnością ruchów (np. opłaca się
graczowi A, który w grze pojedynczej musi ruszać się jako pierwszy ukształtować tę grę
jako grę z preferencją drugiego).
• Zaproponowano narzędzia ułatwiające danemu graczowi podjęcie decyzji odnośnie wyboru
określonej strategii gry w grze podwójnej dla różnych wariantów kolejności ruchów graczy,
z uwzględnieniem znajomości bądź nieznajomości celu, do jakiego w swych decyzjach dążył
będzie drugi gracz.
• Zaproponowano metodę określania pożądanej kolejności ruchów graczy.
• W ramach szczegółowych osiągnięć pracy należy wymienić:
– Wyrażenie za pośrednictwem zależności matematycznych indywidualnie efektywnego,
jak też różnych antagonistycznych celów graczy.
– Nakreślenie różnicy oraz wzajemnych zależności pomiędzy celem antagonistycznym,
a celem złośliwym.
– Wykazanie ograniczonej skuteczności, a w szczególnym przypadku wręcz odwrotnych
skutków wysuwania gróźb gry w sposób antagonistyczny w przypadku nieznajomości
celu do jakiego dąży drugi gracz.
97
98
DODATEK . ZAKOŃCZENIE
– Odkrycie przypadku, w którym niewiarygodność gracza może stać się jego silnym
atrybutem w kontekście realizacji określonego celu.
– Wskazanie na zmianę znaczenia pojęcia „efektywność”, a co się z tym wiąże na niebezpieczeństwo dokonywania zewnętrznych regulacji w przypadku, gdy gracze dążą do
antagonistycznych celów.
Analiza gier podwójnych, w których gracze mogą stosować strategie antagonistyczne stanowi
w istocie łącznik pomiędzy jednokryterialnymi grami dwuosobowymi, a wielokryterialnymi grami wieloosobowymi. Ów łącznik stanowi w istocie wstęp, realizację pierwszych zrębów analizy
tych ostatnich. Z racji na bogactwo zagadnienia i skalę skomplikowania problemu analiza gier
wieloosobowych i wielokryterialnych stanowi w dalszym ciągu wyzwanie i zaproszenie do podjęcia dalszych studiów nad tym tematem.
Bibliografia
[1] Roger Dawson. Sekrety udanych negocjacji. Wydawnictwo Santorski & Wamex, Warszawa,
1997.
[2] Roger Fisher, William Ury, Bruce Patton. Dochodząc do TAK – Negocjowanie bez poddawania się. Polskie Wydawnictwo Ekonomiczne, Warszawa, 2000.
[3] Sylwester Laskowski. Game against nature: playing on competitive telecommunications
services market without knowledge of competitors’ costs. The Fourth International Conference on Decision Support for Telecommunications and Information Society, Warsaw, 2004.
National Institute of Telecommunications.
[4] Sylwester Laskowski. Modelowanie gry rynkowej na konkurencyjnym rynku telekomunikacyjnym. Telekomunikacja i techniki Informacyjne, 3(4), 2004.
[5] Sylwester Laskowski. O roli informacji na temat macierzy wypłat w konkurencyjnej grze
na rynku telekomunikacyjnym. Telekomunikacja i techniki Informacyjne, 3(4), 2004.
[6] Sylwester Laskowski. Wspomaganie procesu ustalania cen detalicznych i negocjacji stawek
rozliczeniowych na konkurencyjnym rynku usług telekomunikacyjnych. Rozprawa doktorska,
Politechnika Warszawska, Wydział Elektroniki i Technik, Warszawa, 2004.
[7] Sylwester Laskowski. Criteria of choosing strategy in games against nature. The Fifth
International Conference on Decision Support for Telecommunications and Information
Society, Warsaw, 2005. National Institute of Telecommunications.
[8] Sylwester Laskowski. O kolejności ruchów w dwuosobowej grze na konkurencyjnym rynku
telekomunikacyjnym z asymetrią informacyjną. Telekomunikacja i techniki Informacyjne,
3(4), 2005.
[9] Sylwester Laskowski. Opracowanie narzędzi analitycznych do wspomagania decyzji dotyczących wysokości opłat taryfikacyjnych i stawek rozliczeniowych na konkurencyjnym rynku
telekomunikacyjnym. Praca statutowa, Instytut Łączności, 2005.
99
100
BIBLIOGRAFIA
[10] Sylwester Laskowski. Wspomaganie procesu ustalania cen detalicznych na konkurencyjnym
rynku telekomunikacyjnym z asymetrią informacyjną. Telekomunikacja i techniki Informacyjne, 3(4), 2005.
[11] Sylwester Laskowski. Wprowadzenie do jednokryterialnych 2-osobowych gier rynkowych o
sumie niezerowej. Telekomunikacja i techniki Informacyjne, 3(4), 2006.
[12] Jacek W. Mercik. Siła i oczekiwania, decyzje grupowe. PWN, Wrocław, 1999.
[13] Włodzimierz Ogryczak. Wspomaganie decyzji w warunkach ryzyka. Skrypt wykładu, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki
i Informatyki Stosowanej, Warszawa, 2002.
[14] Howard Raiffa. The art and since of negotiation. Harvard University Press, Cambridge
Massachusetts, 1982.
[15] Bernard Roy. Wielokryterialne wspomaganie decyzji. Wydawnictwo Naukowo-Techniczne,
Warszawa, 1990.
[16] Robert A. Rządca. Negocjacje w interesach. Polskie Wydawnictwo Ekonomiczne, Warszawa,
2003.
[17] Philip D. Straffin. Teoria gier. Wydawnictwo Naukowe Scholar, Warszawa, 2001.
[18] William Ury. Odchodząc od NIE – negocjowanie od konfrontacji do kooperacji. Polskie
Wydawnictwo Ekonomiczne, Warszawa, 2000.
[19] Michael Watkins. Sztuka negocjacji w biznesie – innowacyjne podejścia prowadzące do
przełomu. Helion, Gliwice, 2005.
[20] Andrzej P. Wierzbicki. Sztuka i techniki negocjacji. Skrypt wykładu, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki i Informatyki
Stosowanej, Warszawa, 1996.
[21] Andrzej P. Wierzbicki. Optymalizacja i wspomaganie decycji. Skrypt wykładu, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki i
Informatyki Stosowanej, Warszawa, 2000.
[22] Nikołaj. N. Worobiew, Edward Kofler, Henryk Greniewski. Strategia gier. Książka i Wiedza,
Warszawa, 1969.

Opracowanie narzędzi analitycznych do

Transkrypt

Podobne dokumenty

Program „Symulator kasyna”

Lista 2

Propozycja projektu

zasady gry

Powiatowy Turniej Scrabble w Garwolinie – 4

PS3

„Daję głowę” jest lekką i pełną humoru grą towarzyską rozgrywaną

Gra karciana Rodziny świata