Informacyjne aspekty gier konkurencyjnych na konkurencyjnym

Transkrypt

Instytut Łączności
Praca statutowa
nr 11.30.002.7
Informacyjne aspekty gier konkurencyjnych
na konkurencyjnym rynku usług telekomunikacyjnych
dr inż. Sylwester Laskowski
Konsultacje:
prof. dr hab. inż. Andrzej P. Wierzbicki
Warszawa, grudzień 2007.
ii
Spis treści
Wprowadzenie
I
ix
Część główna pracy
1
1 Niepewność i ryzyko w grach rynkowych
3
1.1
Niepewność, ryzyko, przewidywalność i informacja . . . . . . . . . . . . . . . . .
3
1.2
Informacja a system rynkowy . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
1.2.1
Niepewność w systemie rynkowym . . . . . . . . . . . . . . . . . . . . . .
5
1.2.2
Nieefektywność rynku wynikła z ograniczeń informacyjnych . . . . . . . .
6
1.2.3
Informacja o rynku a rynek informacji . . . . . . . . . . . . . . . . . . . .
10
1.3
Źródła niepewności i ryzyka w rzeczywistych grach rynkowych . . . . . . . . . . .
10
1.4
Podsumowanie i wnioski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
2 Model konkurencyjnej gry rynkowej
15
2.1
Podstawowe pojęcia teorii gier . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
2.2
Modele gry rynkowej na konkurencyjnym rynku telekomunikacyjnym . . . . . . .
17
2.2.1
Identyfikacja rynków . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
2.2.2
Identyfikacja graczy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
19
2.2.3
Identyfikacja strategii . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
2.2.4
Identyfikacja funkcji wypłaty . . . . . . . . . . . . . . . . . . . . . . . . .
21
Rodzaje gier na rynku telekomunikacyjnym i ich własności . . . . . . . . . . . . .
24
2.3
3 Modelowe ujęcie ograniczeń informacyjnych w grze rynkowej
27
3.1
Informacyjna reprezentacja graczy w grze . . . . . . . . . . . . . . . . . . . . . .
27
3.2
Klasyfikacja gier ze względu na informacyjną reprezentację graczy
29
iii
. . . . . . . .
4 Gry z niepełną informacją w ujęciu J. C. Harsanyi
4.1
4.2
Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
4.1.1
Teoria gier i klasyczna ekonomia . . . . . . . . . . . . . . . . . . . . . . .
33
4.1.2
Problem niekompletnej informacji . . . . . . . . . . . . . . . . . . . . . .
34
Dwu-osobowa I-gra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
4.2.1
Model bazujący na przypuszczeniach coraz wyższego rzędu . . . . . . . .
35
4.2.2
Negocjacje pomiędzy Stanami Zjednoczonymi a Związkiem Radzieckim,
odnośnie kontroli zbrojeń . . . . . . . . . . . . . . . . . . . . . . . . . . .
36
4.2.3
Interpretacja I-gier skupiona na typach graczy . . . . . . . . . . . . . . .
37
4.2.4
Dwa aktywne typy i ich funkcje wypłaty . . . . . . . . . . . . . . . . . . .
38
4.2.5
Zakres posiadanej wiedzy w grze . . . . . . . . . . . . . . . . . . . . . . .
38
4.2.6
Dwa istotne rozróżnienia . . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
4.2.7
Model probabilistyczny I-gry G . . . . . . . . . . . . . . . . . . . . . . . .
40
4.2.8
Przekształcenie I-gry G z niepełną (incomplete) informacją w grę G∗ z
4.2.9
pełną (complete) ale niedoskonałą (imperfect) informacją . . . . . . . . .
41
Warunkowe prawdopodobieństwa w grze G∗ . . . . . . . . . . . . . . . . .
42
4.2.10 Semi-warunkowa funkcja wypłaty dwu aktywnych typów w grze
4.3
33
. . . . .
42
N-osobowa I-gra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
44
4.3.1
Typy różnych graczy, aktywny zbiór, i właściwe zbiory w n-osobowej I-grze 44
4.3.2
Niektóre prawdopodobieństwa . . . . . . . . . . . . . . . . . . . . . . . . .
45
4.3.3
Profile strategii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
46
4.3.4
Warunkowe funkcje wypłaty . . . . . . . . . . . . . . . . . . . . . . . . . .
47
4.3.5
Semi-warunowe funkcje wypłaty . . . . . . . . . . . . . . . . . . . . . . .
48
5 Gry z niepełną informacją – uzupełnienie podejścia
J. C. Harsanyi
49
5.1
Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
49
5.2
Dany gracz nie zna swojego typu . . . . . . . . . . . . . . . . . . . . . . . . . . .
50
5.2.1
Streszczenie podejścia Harsanyi . . . . . . . . . . . . . . . . . . . . . . . .
50
5.2.2
Dany gracz nie zna swojego typu i zna typ innych graczy . . . . . . . . .
53
5.2.3
Dany gracz nie zna swojego typu i nie zna typu innych graczy . . . . . .
55
5.2.4
Przypadki niesymetrycznej informacji . . . . . . . . . . . . . . . . . . . .
57
5.3
Dany gracz wykonuje ruch jako pierwszy . . . . . . . . . . . . . . . . . . . . . . .
57
5.4
Nieznana kolejność ruchów graczy
. . . . . . . . . . . . . . . . . . . . . . . . . .
59
5.5
Wartość informacji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
60
iv
II
Dodatki i Zakończenie
61
A Preferowana kolejność ruchów a równowaga Nasha i model gry Stackelberga 63
A.1 Preferowana kolejność ruchów w grze pojedynczej . . . . . . . . . . . . . . . . . .
65
A.2 Preferowana kolejność ruchów a równowaga Nasha . . . . . . . . . . . . . . . . .
71
A.3 Preferowana kolejność ruchów a model gry Stackelberga . . . . . . . . . . . . . .
74
A.4 Wnioski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
78
B Narzędzia wspomagania decyzji w warunkach niepewności i ryzyka
79
B.1 Narzędzia wspomagania decyzji w warunkach niepewności - kryteria wyboru strategii w grze przeciwko naturze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
79
B.1.1 Kryterium Walda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
79
B.1.2 Kryterium optymistyczne . . . . . . . . . . . . . . . . . . . . . . . . . . .
80
B.1.3 Kryterium Hurwicza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
80
B.1.4 Kryterium Laplace’a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
81
B.1.5 Kryterium Savage’a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
82
B.1.6 Kryterium maksymalizacji liczby największych wygranych (LNW) . . . .
83
B.1.7 Kryterium maksymalizacji liczby największych wygranych z progiem uznania (LNWP) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
83
B.1.8 Kryterium maksymalizacji sumy największych wypłat z progiem uznania
(SNWP) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
84
B.1.9 Kryterium maksymalizacji wartości oczekiwanej wypłaty z progiem uznania (EWP) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
85
B.1.10 Kryterium minimalizacji wartości oczekiwanej straty z progiem uznania
(ESP) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
85
B.1.11 Kryterium maksymalizacji progowej wartości oczekiwanej wypłaty (PEW)
86
B.1.12 Kryterium minimalizacji progowej wartości oczekiwanej straty (PES) . . .
86
B.2 Narzędzia wspomagania decyzji w warunkach ryzyka . . . . . . . . . . . . . . . .
87
C John’a C. Harsanyi: Dwustronne negocjacje w sytuacji nieznajomości funkcji
użyteczności kontrpartnera w grze.
89
C.1 Próba ustalenia wartości punktu zgody . . . . . . . . . . . . . . . . . . . . . . . .
89
C.2 Arbitrażowe rozwiązanie Zuethen’a-Nash’a w przypadku znajomości funkcji użyteczności . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
91
C.3 Estymacja arbitrażowego rozwiązania Zeuthen’a-Nash’a w przypadku nieznajomości funkcji użyteczności . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
v
92
C.4 Problem zbieżności i wzajemnej kompatybilności sekwencji Ai (n) . . . . . . . . .
94
C.5 Model gry ułatwiający doprowadzenie do komplementarności punktów zgody, w
przypadku dopuszczenia blefowania . . . . . . . . . . . . . . . . . . . . . . . . . .
C.6 Ograniczona użyteczność przetargu (bargaining)
. . . . . . . . . . . . . . . . . .
97
98
Zakończenie
101
Bibliografia
110
vi
Spis tabel
2.1
Ilustracja pojęć strategia i wypłata.
. . . . . . . . . . . . . . . . . . . . . . . . .
A.1 Przykładowa macierz wypłat w grze podwójnej.
17
. . . . . . . . . . . . . . . . . .
64
A.2 Macierz wypłat w grze pojedynczej. . . . . . . . . . . . . . . . . . . . . . . . . .
65
A.3 Macierz wypłat w grze pojedynczej z preferencją pierwszego. . . . . . . . . . . .
65
A.4 Macierz wypłat w grze pojedynczej z preferencją drugiego. . . . . . . . . . . . . .
66
A.5 Macierz wypłat w grze pojedynczej z jednostronną preferencją drugiego. . . . . .
68
A.6 Macierz wypłat w grze, w której mimo identyczności wypłat gracza B dla strategii
b1 i b2 nie są one niejednoznaczne. . . . . . . . . . . . . . . . . . . . . . . . . . .
70
A.7 Macierz wypłat w grze, w której mimo różnych wartości wypłat dla strategii
gracza B, strategie te są niejednoznaczne wówczas, gdy gracz B wykonuje ruch
jako pierwszy. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
70
A.8 Macierz wypłat w grze bez preferencji ruchów. . . . . . . . . . . . . . . . . . . .
71
A.9 Macierz wypłat w grze z preferencją pierwszego, w której jest tylko jedno rozwiązanie
równowagowe.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
72
A.10 Macierz wypłat w grze z preferencją pierwszego, w której nie ma rozwiązania
równowagowego. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
72
A.11 Macierz wypłat w grze pojedynczej z preferencją drugiego, w której istnieje rozwiązanie
równowagowe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
73
A.12 Ilustracja przypadku, gdy graczowi A opłaca się ruszyć jako pierwszy, gdy gracz
B zna jego macierz wypłat i jako drugi, gdy gracz B nie zna jego macierzy wypłat. 77
vii
viii
Wprowadzenie
Jeśli nawet ostatecznie nie o nią samą chodzi1 – informacja jest dobrem istotnym i podstawowym w działalności człowieka. Wraz ze zmianami cywilizacyjnymi i społecznymi, jakie w
głównej mierze zapoczątkowane zostały rozwojem i upowszechnieniem technologii komunikacji
elektronicznej, informacja staje się coraz bardziej równoprawnym – względem kapitału i pracy –
determinantem sukcesu w działalności gospodarczej. Informacja stała się na globalną skalę dobrem o wartości nie tylko poznawczej, ale również i komercyjnej. Hasło „wiedzieć więcej” coraz
łatwiej jest przekształcić w realność stwierdzenia „odnieść większy sukces”.
„Większy” jest pojęciem względnym. Zdaje się, że – niestety – coraz rzadziej owa względność
zamyka się w ramach stwierdzenia rozwoju, poprawy wyników na przestrzeni historii działalności
określonego podmiotu. Wymiar czasowy zdaje się odgrywać coraz mniejszą rolę w znaczeniu
pojęcia „większy”. Dominującym znaczeniem staje się wymiar przestrzenny. Innymi słowy nie
wystarcza już odnieść sukces większy niż w przeszłości, teraz trzeba odnieść sukces większy
niż inni! Pojęcie „przewagi konkurencyjnej” staje się niemalże dogmatyczną zasadą działalności
rynkowej.
Nie pozostaje to bez wpływu na podejście do informacji. Zasada osiągania „przewagi konkurencyjnej” wyznacza jednoznaczny kierunek: „wiedzieć więcej niż inni”. Znamienna dla działalności gospodarczej rywalizacja o dostęp do ograniczonych zasobów spotyka się więc z na pozór
paradoksalną sytuacją czerpania korzyści z faktu ograniczonego dla innych dostępu do informacji. Okazuje się jednak, iż w niektórych przypadkach takie podejście zawodzi. Choć niejednokrotnie zasada „wiedzieć więcej niż inni” istotnie rodzi możliwość odniesienia większego sukcesu, to
istnieją również przypadki, w których niewiedza innych bywa niekorzystna dla tego, kto wie
[46, 51].
Istotnym jest stwierdzenie, że dla danego decydenta, uczestnika gry rynkowej (gracza) zawsze
jest lepiej posiadać większą niż mniejszą wiedzę – lepiej jest wiedzieć, niż nie wiedzieć. Wiedza o
danej sytuacji decyzyjnej często przekłada się na możliwość lepszego ocenienia skutków podjęcia
1
„Where is the wisdom we have lost in knowledge? Where is the knowledge we have lost in information?”
T.S. Eliot.
ix
określonych działań czy decyzji, w ten sposób ułatwiając wyłonienie działania lub decyzji najlepszych. Wiedza ta jednakże nie wyklucza możliwości wyboru opcji, którą zamierzało się wybrać
w sytuacji niewiedzy. Dlatego też z obiektywnego punktu widzenia, zawsze jest lepiej wiedzieć
niż nie wiedzieć. Rzecz jasna subiektywne uwarunkowania danego decydenta mogą sprawić, iż
określona wiedza (w szczególności dotycząca możliwości wystąpienia szczególnie niekorzystnych
sytuacji) może niekorzystnie wpłynąć na racjonalność myślenia decydenta i w ten sposób przyczynić się do wybrania opcji gorszej, niźli w przypadku niewiedzy. Możliwą jest również sytuacja,
w której wiedza, w szczególności wiedza o charakterze probabilistycznym zachęca decydenta do
podjęcia pewnego ryzyka w swojej decyzji, co przynieść może rozwiązanie gorsze od wyniku
dostępnego w sytuacji niewiedzy. Obiektywnie jednak punkt wyjścia i w tym przypadku (znajomość rozkładu prawdopodobieństwa różnych zdarzeń) jest lepszy, niż w przypadku braku tego
typu informacji: opcja dostępna w sytuacji niewiedzy w dalszym ciągu pozostaje dostępną.
Niniejsza praca poświącona jest analizie wybranych aspektów związanych z kwestią informacji i jej braku w konkurencyjnych grach rynkowych. Bezpośrednią inspiracją podjęcia tematu jest
problematyka konkurencji na rynku telekomunikacyjnym. Podejmowane zagadnienia odnoszą się
jednak równie dobrze do wielu innych sytuacji i to nie tylko o charakterze gier rynkowych.
x
Część I
Część główna pracy
1
Rozdział 1
Niepewność i ryzyko w grach
rynkowych
1.1
Niepewność, ryzyko, przewidywalność i informacja
Niepewność jest pojęciem odnoszącym się do zjawisk przyszłych. To co, było dotychczas i to co
dzieje się w chwili obecnej jest zawsze pewne. Niepewną może być jedynie przyszłość.
Niepewność rodzi się z braku pewnych, czyli wiarygodnych informacji odnośnie tego, co
wydarzy się w przyszłości: za chwilę, jutro, za miesiąc, za rok itd. Postawić zatem można znak
równości pomiędzy pojęciem niepewności a nieznajomością przyszłości.
Każda decyzja podejmowana w chwili obecnej posiada pewne skutki w przyszłości. A zatem
o tyle, o ile niepewną jest przyszłość, o tyle niepewnymi są i owe skutki, a zatem o tyle też sam
proces decyzyjny nabiera znamion decyzji w warunkach niepewności. Ponieważ przyszłość jest
zawsze w jakiejś mierze niepewna, to i praktycznie każdy proces podejmowania decyzji określić
można jako proces podejmowania decyzji w warunkach niepewności. A zatem proces podejmowania decyzji w warunkach niepewności jest najbardziej ogólną kategorią procesów decyzyjnych.
Wszystkie inne stanowią jego przypadek szczególny.
Chaos i przypadkowość nie stanowią nadrzędnych zasad rządzących światem. Świat (tak w
jego mikro, jak i makro ujęciu) jest zawsze w jakiejś mierze przewidywalny, poddany pewnym
zasadom, mechanizmom, regułom, które czynią pewne zjawiska i pewne skutki tych zjawisk bardziej prawdopodobnymi od innych. Świat, a w tym i istniejące w nim procesy decyzyjne jest więc
nie tyle światem niepewności co światem ryzyka (jeśli posłużyć się klasycznym rozróżnieniem
przyjętym w teorii decyzji przyjmującej, że o ryzyku mowa jest tam, gdzie znane są prawdopodobieństwa występowania określonych zjawisk [66]).
Odróżnić jednakże trzeba tu dwie kwestie: obiektywność zasad rządzących światem i subiek3
4
ROZDZIAŁ 1. NIEPEWNOŚĆ I RYZYKO W GRACH RYNKOWYCH
tywną świadomość danego podmiotu odnośnie istnienia tych zasad. I tak zasady czynią świat i
istniejące w nim zjawiska i procesy bardziej przewidywalnymi w sensie obiektywnym, jednakże
dla danego podmiotu, próbującego przewidywać przyszłość (stan świata w chwili przyszłej) celność tego przewidywania zależna jest od stopnia znajomości tychże zasad. Obiektywnie więc
świat będzie zawsze światem ryzyka, subiektywnie jednak pozostawać może światem niepewności.
Kluczowego znaczenia nabiera tu element informacji, czy wiedzy (jeśli rozumieć ją jako informację poddaną procesom selekcji, weryfikacji i strukturyzacji), a nawet mądrości (jeśli rozumieć
ją jako umiejętność dokonywania trafnych wyborów pomiędzy przedmiotami na pozór nierozróżnialnymi). Wiedza o tym, co wydarzy się (czy raczej wydarzyć się może) w przyszłości zależna
jest od wiedzy odnośnie stanu chwili obecnej jak również zasady, która tę chwilę przetransformuje
w przyszłość.
Użyte wyżej pojęcie zasady ma tu znaczenie bardzo szerokie. W szczególności może to być
zasada ściśle deterministyczna (jak np. zasada grawitacji), jak również zasada o charakterze
probabilistycznym (jak np. wewnętrzna zasada podejmowania decyzji przez człowieka obdarzonego wolną wolą1 ).
Zakres niewiedzy (jak i z konieczności – z racji na idealnie symetryczne przeciwieństwo –
zakres wiedzy) może być teoretycznie rzecz biorąc nieograniczony. Teoretycznie rzecz ujmując
wydarzyć może się niemalże wszystko (przyszłość może przyjmować nieskończoną liczbę stanów,
np. moneta podrzucona do góry może upaść wskazując na orła lub reszką, może stanąć na
krawędzi, może w ogóle nie upaść, może rozsypać się na dwie części, może rozsypać się na trzy
części, może zniknąć, może zamienić się w ptaka lub krople deszczu2 ... itd.). Doświadczenie
czerpane z historii pozwala nam jednak z dość dużym prawdopodobieństwem zakładać, że w
praktyce przyszłość przyjmie jeden ze stanów należących do mimo wszystko ograniczonego zbioru
(orzeł lub reszka).
W teorii decyzji w warunkach niepewności przyjęło się czynić takie minimalne (a mimo to
silne) założenie, że liczba stanów w przyszłości (co bywa określane jako liczba stanów natury
[83]) jest ustalona, ograniczona (a często nawet skończona) i co więcej znana decydentowi. Nieznana jest jednakże zasada (ani w sensie deterministycznym, ani w sensie probabilistycznym)
przekształcająca chwilę obecną w jeden ze stanów przyszłości. Zwykle zakłada się też, że znany
jest wpływ określonego stanu w przyszłości na skutek decyzji podjętej w chwili obecnej. W praktyce oznacza to również, że znana jest zasada transformująca podjętą decyzję w ów skutek (przy
1
Oczywiście założenie o probabilistycznym charakterze decyzji podejmowanych przez ludzi jest tu jedynie
jednym z możliwych ujęć o charakterze modelowym. Przy takim podejściu przyjąć można, że decyzje zgodne z
wewnętrznym systemem wartości człowieka są bardziej prawdopodobne od decyzji z tym systemem sprzecznych.
2
Bez wątpienia znajdą się tacy, co i tę sytuację uznają za przynajmniej teoretycznie możliwą.
1.2. INFORMACJA A SYSTEM RYNKOWY
5
założeniu znanego stanu przyszłości). Co więcej, zakłada sie ponadto, iż decydent podejmujący decyzje jest w stanie właściwie ocenić subiektywną (czyli z jego punktu widzenia) wartość
określonego skutku, co więcej porównać ją z wartością innych skutków i w ten sposób stworzyć
spójną ich hierarchię. Mówi się więc o znajomości tzw. funkcji wartości czy funkcji użyteczności
– różnorako definiowanej [66, 98] – decydenta. I na koniec zakłada się, że decydent dobrze wie,
jakie decyzje ma do dyspozycji.
Z powyższego widać jasno, że teoria wspomagania decyzji w warunkach niepewności w
punkcie wyjścia zakłada posiadanie dość bogatego zakresu informacji (czyli ograniczenia istniejącej niepewności), która jest niezbędna do tego, by dokonać jakiejkolwiek analizy sytuacji
decyzyjnej.
Teoria wspomagania decyzji w warunkach ryzyka idzie o krok dalej, zakładając, że znane
są prawdopodobieństwa wystąpienia poszczególnych stanów w przyszłości (w przypadku decyzji
w warunkach niepewności przyjmuje się, że prawdopodobieństwa te są nie znane, co z punktu
widzenia analizy wymusza założenie jednakowości tych prawdopodobieństw3 ).
1.2
Informacja a system rynkowy
1.2.1
Niepewność w systemie rynkowym
Zgodnie z wcześniejszymi ustaleniami, dla pełnego wyeliminowania niepewności z procesów decyzyjnych, czyli precyzyjnego przewidzenia przyszłego skutku podjętej decyzji, koniecznym jest
posiadanie pełnej informacji na temat:
• Aktualnego stanu otoczenia tworzącego kontekst i warunki początkowe towarzyszące podejmowanej decyzji;
• Charakteru zasady przekształcającej podjętą decyzję w skutek.
3
Zaobserwować tu można swoisty paradoks zachodzący pomiędzy oboma teoriami. Jak to wcześniej wspom-
inano teoria podejmowania decyzji w warunkach niepewności jest najbardziej ogólną teorią w tym sensie, że nie
wymaga posiadania informacji na temat prawdopodobieństwa występowania poszczególnych stanów przyszłości.
W tym sensie teoria podejmowania decyzji w warunkach ryzyka jest przypadkiem szczególnym teorii podejmowania decyzji w warunkach niepewności (otrzymuję się ją z tej drugiej poprzez dołożenie założenia znajomości
prawdopodobieństw występowania poszczególnych stanów przyszłości – poprzez ustalenie wartości określonych
zmiennych, tj. prawdopodobieństw). Jednakże z drugiej strony powiedzieć można, że to teoria podejmowania decyzji w warunkach niepewności jest szczególnym przypadkiem teorii podejmowania decyzji w warunkach ryzyka, a
to z tego względu, że pierwszą otrzymuje się z drugiej poprzez założenie jednakowych wartości prawdopodobieństw
występowania stanów przyszłości (które zgodnie z teorią podejmowania decyzji w warunkach ryzyka są ustalone
i znane).
6
Przy czym jeśli wyżej wspomniany stan otoczenia i/lub zasada będą miały charakter probabilistyczny, to skutek będzie mógł być przewidziany jedynie w sposób probabilistyczny (proces decyzyjny będzie procesem w warunkach ryzyka). Jeśli zaś stan otoczenia określony będzie
w sposób jednoznaczny i zasada będzie miała charakter deterministyczny, to skutek podjęcia
określonej decyzji będzie możliwy do przewidzenia w sposób jednoznaczny.
W przypadku systemów rynkowych o informacji lub jej braku (ograniczeniu) mówić możemy
w dwóch perspektywach: podmiotowej i przedmiotowej. W perspektywie podmiotowej pytamy o
to, kto posiada lub nie posiada określonej informacji. W perspektywie przedmiotowej pytamy o
to co ów ktoś wie lub czego nie wie. Obie perspektywy określają wspólnie, choć oczywiście nie
w sposób wyczerpujący to, co wyżej nazwaliśmy stanem otoczenia i zasadą. Każdy z podmiotów
funkcjonujących na określonym rynku odgrywa określoną rolę na tym rynku (jest konsumentem,
dostawcą usług, regulatorem itp.) Od informacji jaką posiada zależy do, w jaki sposób odgrywał
będzie tę rolę (jakie decyzje będzie podejmował), wpływając tym samym na stan otoczenia w
jakim funkcjonuję (podejmują swoje decyzje) inne podmioty. Jednocześnie zaś jego decyzje kształtują sam mechanizm rynkowy, czyli ową zasadę przekształcającą decyzje innych podmiotów
w konkretne skutki. Innymi słowy decyzje danego podmiotu (wynikłe z zakresu posiadanej przez
niego informacji) określają stan otoczenia i zasadę dla innych podmiotów. Decyzje tych ostatnich zaś (wynikłe z informacji posiadanej przez nich) określają stan otoczenia i zasadę dla tegoż
podmiotu.
Widać zatem, że dla usunięcia elementu niepewności z systemu rynkowego koniecznym byłaby nie tylko wiedza na temat tego, kto na danym rynku funkcjonuje i to nawet w najszerszym
rozumieniu owego pojęcia, uwzględniającym pełną charakterystykę owych podmiotów (w tym
ich cele, wartości, sposoby postępowania itp.). Drugim koniecznym elementem byłaby wiedza
na temat tego co owe podmioty wiedzą na temat siebie nawzajem, w tym również co wiedzą na
temat tego co wiedzą inni.
Widać zatem, iż ograniczenia informacyjne jakim podlegają poszczególne podmioty funkcjonujące w ramach określonego systemu rynkowego, w sposób nieunikniony determinują niepewność
jego funkcjonowania, a więc i niepewność skutków decyzji podejmowanych przez poszczególne
podmioty. W szczególności zaś niepewnym jest to, czy cały system działał będzie w sposób
efektywny.
1.2.2
Nieefektywność rynku wynikła z ograniczeń informacyjnych
Funkcjonujące w modelu konkurencji doskonałej założenie posiadania przez pomioty pełnej informacji odnośnie wszelkich faktów związanych z danym system rynkowym [3] w praktyce nigdy
nie jest spełnione. Rodzi to zagrożenie nieefektywnego funkcjonowania tegoż systemu. Ta nieefek-
7
tywność, swoista zawodność mechanizmu rynkowego, a uprzednio niedoinformowanie ujawniać
się może na trzech poziomach:
• Poziom relacji handlowych;
• Poziom konkurencji;
• Poziom regulacji.
Ograniczenia informacyjne na poziomie relacji handlowych
Na poziomie relacji handlowych, relacji kupno-sprzedaż ograniczenia informacyjne prowadzić
mogą do:
• Niezawarcia transakcji korzystnej dla obu stron;
• Zawierania niekorzystnych (co najmniej dla jednej ze stron) transakcji;
• Niedotrzymania warunków zawartej transakcji.
Każdy z tych trzech przypadków rozpatrywać można jako czynnik zwiększający zawodność mechanizmu rynkowego w procesie efektywnej alokacji zasobów. Każdy z nich wynika też z braku
informacji nieco innego typu. Są to odpowiednio:
• Brak należytej informacji na temat cech oferowanego produktu i korzyści związanych z ich
nabyciem;
• Brak należytej informacji na temat dostępności alternatywnych sprzedawców lub nabywców;
• Brak należytej informacji na temat wiarygodności partnera w relacji handlowej.
Brak należytej informacji na temat cech oferowanego produktu i korzyści związanych z ich
nabyciem prowadzi do tego, że korzystna dla każdej ze stron transakcja może nie zostać zawarta. Z pozoru problem wydaje się łatwy do pokonania, bowiem w interesie sprzedawcy jest
przekazanie stosownych informacji na temat oferowanego produktu. Jednakże w niektórych przypadkach jest to o tyle trudne, że korzyści z nabycia określonego dobra ujawniają się dopiero po
upływie długiego czasu, a przy tym uzależnione są od przypadków losowych. Taka sytuacja
zachodzi dla przykładu w kontekście finansowania rozwoju służby zdrowia. Co więcej informacja o oferowanym produkcie może stanowić istotną część samego produktu (jak to jest np. w
przypadku sprzedaży dostępu do treści artykułów naukowych), a więc z definicji nie może być
8
udostępniona przed jej nabyciem. I wreszcie wiąże się z tym kwestia zaufania nabywcy względem
sprzedawcy, że przekazywane informacje są wiarygodne.
Charakterystycznym efektem związanym z brakiem należytej informacji na temat cech oferowanego produktu i korzyści związanych z ich nabyciem jest tzw. selekcja negatywna (adverse
selection), która prowadzi do załamania rynku dóbr wysokiej jakości. Wynika to z faktu, że
nabywcy, znając jedynie przeciętną jakość oferowanych dóbr, nie są gotowi do zapłacenia wyższej
ceny za domniemane dobro wysokiej jakości. W następstwie zanikają zachęty do oferowania dóbr
wyższej jakości, dominująca na rynku przeciętna jakość stale się obniża, a co za tym idzie, spada
także gotowość do zapłaty [6].
Brak należytej informacji na temat dostępności alternatywnych sprzedawców lub nabywców
prowadzi często do zawarcia transakcji niekorzystnej dla jednej ze stron. Dzieje się tak zawsze
wówczas gdy istnieją alternatywni sprzedawcy oferujący substytucyjny produkt lepszej jakości i/lub po niższej cenie, lub też gdy istnieją alternatywni nabywcy gotowi zapłacić więcej za
oferowane im dobro. Trudność z przełamaniem tej bariery polega na tym, że w ramach nawiązywanej relacji handlowej w interesie stron nie jest przekazywanie partnerom tego typu informacji.
Każda ze stron musi zabiegać o jej pozyskanie inną drogą.
Brak należytej informacji na temat wiarygodności partnera w relacji handlowej może doprowadzić tak zarówno do nie zawarcia korzystnej dla obu stron transakcji (niedostateczny
poziom zaufania)4 , jak też do zawarcia transakcji niekorzystnej, lub niedotrzymania pierwotnie
ustalonych warunków współpracy (nadmierny poziom zaufania), w szczególności zaś wymuszenia
ich zmiany na jednostronnie korzystne5 .
Ograniczenia informacyjne na poziomie konkurencji
Ograniczenia informacyjne na poziomie konkurencji, na poziomie wzajemnej zależności podmiotów biorących udział w grze rynkowej prowadzić mogą do wyboru nieefektywnych strategii
gry. Skutek określonej decyzji danego gracza uzależniony jest od decyzji innych graczy stąd ich
4
„Ponieważ nie wszyscy nabywcy zachowują się zgodnie z kontraktem względnie z należytą starannością, a
oferenci kalkulują swoje ceny w taki sposób, aby nie ponieść straty, w cenach pojawia się premia za ryzyko. W
ten sposób uczestnicy spełniający warunki kontraktu obciążeni są względnie wysoką ceną i dlatego skłonni są
rezygnować z nabywania pewnych dóbr, a w ekstremalnej sytuacji nie są zawierane dalsze transakcje z uczciwymi
uczestnikami rynku i rynek zawodzi, ponieważ z powodu wysokiej ceny na rynku pozostają jedynie oportuniści.”
[6]
5
Z taką sytuacją możemy mieć miejsce wówczas, gdy nawiązanie współpracy wiąże się z poniesieniem przez
jedną ze stron istotnych kosztów o charakterze nieodwracalnym (tzw. koszty utopione – sunk costs), które zwrócić
się mogą jedynie w przypadku ostatecznego sfinalizowania transakcji. W takim przypadku istnieje niebezpieczeństwo wyzysku przez drugą stronę, która mając świadomość poczynionych przez partnera inwestycji stawia go przed
alternatywą zerwania współpracy, lub nawiązania jej na nowych, mniej korzystnych dla partnera warunkach.
9
nieznajomość przekłada się na niepewność odnośnie ostatecznego wyniku gry, a zatem i stopnia
realizacji założonego celu każdego z graczy. Konkurenci (aktualni i potencjalni) oraz ich decyzje
definiują bowiem tak stan otoczenia jak i zasadę, o których uprzednio była mowa.
Dopóki decyzje konkurentów nie są faktem, nie zostały podjęte, dany gracz stoi przed
koniecznością ich przewidywania. (Rzecz jasna przewidywania te dotyczyć muszą również kwestii
rozpoznania, kto w ogóle jest konkurentem.) Decyzje te uzależnione są od celów konkurencyjnych
graczy, od dostępnych sposobów ich realizacji (strategii gry) jak również od posiadanej przez nich
informacji, w tym informacji na poziomie wyżej omawianych relacji handlowych, na poziomie
regulacyjnym (o czym będzie dalej mowa) jak również informacji o celach, dostępnych strategiach i posiadanej informacji graczy względem nich konkurencyjnych. Ograniczoność dostępu
do informacji na każdym z poziomów i w kontekście każdego z zagadnień zwiększa niepewność
funkcjonowania systemu rynkowego.
Ograniczenia informacyjne na poziomie regulacyjnym
Ograniczenia informacyjne na poziomie regulacyjnym (szerzej prawnym) rozpatrywać można z
punktu widzenia podmiotów regulujących jak i poddanych regulacji.
Podmioty regulujące określają (próbują określać) kształt mechanizmu rynkowego, wyznaczają właściwe mu granice i to tak na poziomie relacji handlowych jak i na poziomie konkurencji.
Od decyzji prawodawców i regulatorów uzależnione bywa to, jacy gracze funkcjonują na rynku,
jakie strategie gry są dla nich dostępne, jaką posiadają informację, jakie ustalają się ceny i
do kogo trafiają wytwarzane na rynku dobra. Regulacja z definicji jest działaniem dążącym do
poprawy efektywności funkcjonowania rynku lub do wyboru określonej efektywności, określonego
rozwiązania efektywnego, Pareto-optymalnego, pożądanego ze względu na cele określonej polityki.
Rynek nie jest bytem statycznym, lecz żywym organizmem rządzącym się własnymi prawami.
Stąd też regulacja, by była efektywną potrzebuje informacji na jego temat. Wszelkie informacje,
o których mowa była w związku z ograniczeniami informacyjnymi na poziomie relacji handlowych
i na poziomie konkurencji, są więc niezbędne jeśli chce się przewidzieć jej skutek. Wniosek stąd,
że pozbycie się niepewności na poziomie regulacyjnym wymagałoby zgromadzenia największej
(względem poziomu relacji handlowych i poziomu konkurencji) ilości informacji na temat całego
systemu rynkowego. Wynika to w głównej mierze stąd, iż wiele regulacji (a wszystkie przepisy
prawa) ma charakter uprzedzający (ex ante) względem konkretnych decyzji graczy rynkowych
czy nabywców dóbr.
Z punktu widzenia podmiotów poddanych regulacji istotnym jest posiadanie informacji na
temat aktualnego systemu prawno-regulacyjnego, jak również środków, które w przyszłości
10
zostaną wdrożone. Innymi słowy niepewność na poziomie regulacyjnym w funkcjonowaniu podmiotów poddanych regulacji wynikać może albo z braku informacji na temat aktualnego stanu
systemu prawno-regulacyjnego, albo z niestabilności tego systemu i braku informacji na temat
przyszłego jego kształtu.
1.2.3
Informacja o rynku a rynek informacji
Niepewność związana z funkcjonowanie systemu rynkowego może być (i w praktyce jest) zmniejszana poprzez różnego rodzaju systemy informacyjne, których celem jest przekazywanie
poszczególnym podmiotom koniecznych im informacji. Budowa tych systemów, a jeszcze bardziej
pozyskanie stosownej informacji nie jest bynajmniej zadaniem prostym. Oczywistym kłopotem
jest tu ilość informacji wynikająca ze złożoności samego systemu rynkowego i związana z tym
trudność jej pozyskiwania, gromadzenia, selekcjonowania i dystrybucji do właściwych adresatów.
Z tego też względu (jak również z innych powodów) same systemy informacyjne niejednokrotnie stają się osobnym systemem rynkowym, na którym oferowanym i kupowanym dobrem jest
sama informacja. Rzecz jasna i ten system podlega ograniczeniom informacyjnym (na różnych
poziomach) prowadząc niejednokrotnie do zawierania transakcji niekorzystnych lub niezawierania transakcji korzystnych, czyniąc w efekcie ów system nieefektywnym.
Istnieje tu oczywista trudność w kontekście próby usprawniania rynkowego systemu informacyjnego: nie można go usprawnić za pomocą lepszego (innego) systemu informacyjnego, bowiem
informacja na temat informacji jest w gruncie rzeczy tą samą informacją. To kolejny powód istnienia niepewności i ryzyka, a co się z tym wiąże możliwej nieefektywności działania pierwotnego
rynku dóbr (nieinformacyjnych).
1.3
Źródła niepewności i ryzyka w rzeczywistych grach rynkowych
Konsumenci i regulatorzy rynku są podmiotami względem danego rynku zewnętrznymi : kształtują warunki jego funkcjonowania (determinują stan otoczenia i zasadę) nie są jednakże uczestnikami gry rynkowej w takim sensie, jak to dotyczy podmiotów odpowiedzialnych za wytwarzanie
dóbr podlegających na tym rynku wymianie. W szczególności nie stosownym jest stwierdzenie odnośnie potencjalnego ich wejścia na rynek. W tym sensie konsumenci i regulatorzy nie
są graczami rynkowymi, nie są uczestnikami gry. Raczej kreują gry, w które grają rzeczywiści
gracze – podmioty prowadzące działalność gospodarczą (w szczególności przedsiębiorstwa telekomunikacyjne).
W tym punkcie dokonamy opisu szeregu zjawisk, które przyczyniają się do tego, że czynny
udział w grze rynkowej (bycie graczem na danym rynku) jest działalnością obarczoną ryzykiem.
1.3. ŹRÓDŁA NIEPEWNOŚCI I RYZYKA W RZECZYWISTYCH GRACH RYNKOWYCH
11
Pierwszym źródłem niepewności i ryzyka dla każdego gracza rynkowego jest jego własna, wewnętrzna sytuacja (zależna oczywiście od czynników zewnętrznych). Poniżej w sposób
przykładowy wymieniono niektóre z nich.
• Ryzyko związane z organizacją i harmonizacją wewnętrznych procesów w firmie procesów,
w tym z właściwą obsługą stosowanych urządzeń i maszyn, zachowaniem harmonogramu
prac itp.
• Ryzyko związane ze stosowaną technologią i wykorzystywanymi środkami technicznymi.
Źródłem ryzyka są tu kwestie właściwego doboru technologii, umiejętności przewidywania
postępu w tym zakresie, jakości wytwarzanych produktów itp.
• Ryzyko na poziomie zarządzania, w tym ryzyko związane z logistyką, z utrzymaniem
lub zdobyciem pożądanej pozycji na rynku, z zachowaniem zgodności z obowiązującym
prawem, z niebezpieczeństwem uzależnienia od posiadanej kadry, lub zwolnienia przydatnych pracowników, z właściwym rozpoznaniem czynników makroekonomicznych (jak inflacja, stopy procentowe, kurs walut, kurs akcji) i mikroekonomicznej (popyt na określone
usługi) czy sytuacji polityczno-ekonomicznej itp.
• Ryzyko finansowe, w tym ryzyko związane z trafnością przyjętej ceny, z szacunkiem ponoszonych kosztów, z zapewnieniem płynności finansowej i zdolności kredytowej, z utrzymaniem udzielonych lub otrzymanych gwarancji, z poczynionymi inwestycjami itp.
• Ryzyko związane z dążeniem do zachowania lub zdobycia dobrej reputacji u klientów,
partnerów i podmiotów wspierających.
Drugim źródłem ryzyka dla każdego gracza rynkowego jest wewnętrzna sytuacja rynkowa (w
tym podejmowane przez innych graczy decyzje), jak również jego zewnętrzne uwarunkowania
(popyt na oferowane produkty czy usługi, ramy prawne, kondycja rynków spokrewnionych, lub
ogólnej gospodarki itp.). W tym kontekście źródłem ryzyka staje się również zasadnicza strategia,
jaką w grze zamierza przyjąć dane przedsiębiorstwo i jej właściwe dopasowanie do wewnętrznych
i zewnętrznych uwarunkowań rynku.
Zasadniczo wyróżnia się trzy rodzaje strategii [104]:
1. Wiodąca pozycja pod względem kosztów całkowitych, polegająca na dążeniu do minimalizacji kosztów świadczonych usług przy wytwarzanych produktów, a co się z tym wiąże
minimalizacji cen.
2. Zróżnicowanie, czyli dążenie do wprowadzenia na rynek unikatowego i trudnego do imitowania produktu lub usługi, w tym wbudowanie w ofertę takich atrybutów produktu lub
systemu współpracy, które zwiększają satysfakcję odbiorcy.
12
3. Koncentracja, czyli adresowanie swoich usług lub produktów do ściśle określonej grupy
odbiorców, świadczenie ściśle i wąsko określonego asortymentu wyrobów, czy skupienie się
na określonym rynku geograficznym.
Strategia wiodącej pozycji pod względem kosztów całkowitych narażona jest na ryzyka związane
ze:
• Zmianą techniczną niweczącą poprzednie inwestycje lub przewagę zdobytą w wyniku uczenia
się;
• Dochodzeniem do niskich kosztów przez nowo wchodzących do danego sektora lub przez
konkurentów, w wyniku naśladownictwa albo przez możliwość zainwestowania w urządzenia
odpowiadające najnowszej technice;
• Niedostrzeganiem potrzeby dokonania zmian w wyrobach lub w marketingu, ze względu
na nadmierną uwagę poświęconą kosztom;
• Inflacją kosztów, ograniczającą możliwość utrzymania przez firmę różnicy cen równoważącej
prestiż znaków firmowych konkurentów lub stosowanie innych sposobów różnicowania
wyrobów.
Zróżnicowanie wiąże się z ryzykiem wówczas, gdy:
• Różnica kosztów między konkurentami o niskich kosztach a zróżnicowaną firmą staje się
zbyt duża; nabywcy, mimo przywiązania do marki, rezygnują z niektórych cech, usług czy
prestiżu zróżnicowanej firmy na rzecz dużych oszczędności,
• Zmniejsza się zapotrzebowanie nabywców na to, co stanowi przedmiot zróżnicowania;
zjawisko to może wystąpić w miarę zwiększania się wyrafinowania nabywców,
• Naśladownictwo zmniejsza dostrzegalne zróżnicowanie; sytuacja taka często występuje w
miarę dojrzewania danego sektora.
Koncentracja jest ryzykowna gdy:
• Zwiększa się różnica kosztów między konkurentami działającymi na szeroką skalę a firmą
skoncentrowaną, co eliminuje korzyści kosztowe wynikające z obsługiwania wąskiego rynku
albo równoważy zróżnicowanie wynikające z koncentracji,
• Różnice w wyrobach lub usługach pożądanych przez wybrany strategiczny segment i przez
cały rynek zmniejszają się,
• Konkurenci wyszukują węższe podsegmenty w wybranym segmencie strategicznym, uzyskując jeszcze większą koncentrację niż firma koncentrująca się.
1.4. PODSUMOWANIE I WNIOSKI
1.4
13
Podsumowanie i wnioski
Liczba czynników wpływających na wynik gry rynkowej nie jest mała. Brak informacji na ich
temat rodzi trudność z oszacowaniem skutków podjętych przez graczy rynkowych (jak również
konsumentów i regulatorów) decyzji. Trudność z oszacowaniem skutków rodzi trudność z samym
podjęciem decyzji: proces podejmowania decyzji staje się procesem niepewnym, ryzykownym, a
przyszłość nabiera w określonych granicach znamion przypadkowości – tym większych, im mniej
informacji posiadają podmioty podejmujące decyzje.
W pewnym zakresie istniejące ograniczenia informacyjne mogą być pokonywane. Całkowita
ich eliminacja nie jest jednakże możliwa w realnych sytuacjach rynkowych. Dlatego też sytuacje
te będą zawsze sytuacjami gry (z racji na istniejące na rynku interakcje) w warunkach niepewności czy ryzyka (z racji na ograniczenia informacyjne). I dlatego też właściwym narzędziem analizy tego typu sytuacji, jak również narzędziem wspomagającym decyzje graczy rynkowych jest
metodologia teorii gier, w szczególności zaś gier z niepełną informacją [28, 29, 41, 46, 49, 50, 51].
14
Rozdział 2
Model konkurencyjnej gry rynkowej
W niniejszym rozdziale przedstawiony zostanie przyjęty model gry na konkurencyjnym1 rynku
telekomunikacyjnym [44, 47]. Do jego opracowania wykorzystano pojęcia teorii gier.
2.1
Podstawowe pojęcia teorii gier
Teoria gier to w najprostszym ujęciu matematyczna teoria konfliktu i kooperacji. Jej pierwsze
fundamentalne pojęcia i zależności zostały sformułowane w 1928 roku przez Johna von Neumanna w pracy „Zur Theorie der Gesellschaftsspiele”. Pierwsza monografia na temat teorii gier
„Theory of Games and Economic Behavior” autorstwa Johna von Neumanna i Oskara Morgensterna opublikowana została w roku 1944. Teoria gier wprowadza w obszar myśli ludzkiej bogaty aparat pojęciowy i zestaw metod analizy i rozwiązywania różnego typu sytuacji o charakterze konfliktu i kooperacji. Sytuacje te, a właściwie ich modele nazywa się po prostu grami
[14, 66, 83, 90, 98, 102].
Gry klasyfikuje się w różny sposób. W zależności od liczby uczestników – graczy, biorących
udział w grze, przyjął się podział na gry 2-osobowe i N-osobowe 2 . W zależności od stopnia
sprzeczności wzajemnych interesów graczy dzieli się gry na gry o sumie zerowej i gry o sumie
1
Charakterystyczną cechą rynku telekomunikacyjnego jest to, iż nie jest on jedynie konkurencyjny. Z racji na
swą specyfikę równie dobrze określić go można jako rynek kooperacyjny. W istocie bowiem podmioty (operatorzy
sieci, dostawcy usług) wielokrotnie pozostają ze sobą z jednej strony w relacji konkurowania o dostęp do ograniczonych zasobów (np. dostęp do abonentów), a z drugiej w relacji współpracy, z racji na konieczność zapewnienia
łączności pomiędzy użytkownikami usług, będących abonamentami różnych sieci.
2
Pojęcie osoby nie ma tu rzecz jasna znaczenia antropologicznego, tak samo jak gracz nie implikuje wprost
skojarzeń ze sportem czy hazardem. Pojęcia te używane są dla określenia podmiotu zaangażowanego w konflikt,
przy czym podmiot ten może być tak zarówno konkretną osobą, jak i grupą osób, a także „naturą”, słowem stroną zaangażowaną w konflikt.
15
16
ROZDZIAŁ 2. MODEL KONKURENCYJNEJ GRY RYNKOWEJ
niezerowej. W grach o sumie zerowej3 wielkość wygranej, tzw. wypłata, jaką uzyskuje jeden
z graczy jest dokładnie równa sumie strat, jakie ponoszą gracze pozostali. W grach o sumie
niezerowej taka zależność nie musi zachodzić i w szczególnych przypadkach zyskiwać może wielu
lub nawet wszyscy. Tu często rozważa się przypadki możliwej kooperacji między graczami.
Wyróżnia się różne sposoby reprezentacji gier – różne modele gier. I tak mamy:
• Gry w postaci ekstensywnej, czyli w postaci tzw. drzewa decyzyjnego.
• Gry w postaci normalnej, w których wartość wypłaty yi dla i-tego gracza definiuje się w
postaci funkcji wygranej fi , będącej zależnością wiążącą wartość wypłaty yi z decyzjami
wszystkich N graczy yi = fi (x1 , . . . , xi , . . . , xN ), przy czym zmienna xi może być wektorem
decyzji elementarnych. Szczególnym przypadkiem gier w postaci normalnej są tzw. gry
macierzowe, kiedy to zbiór decyzji (nazywanych tu strategiami ) poszczególnych graczy jest
dyskretny, a zbiór wypłat dla poszczególnych graczy przedstawia się w formie macierzy.
• Gry w postaci funkcji charakterystycznej, w których każdemu podzbiorowi graczy S ⊆ N
(tzw. koalicji) przypisuje się wartość wypłaty v(S).
Wyróżnić można również podział na gry jednorazowe i powtarzalne 4 .
Kluczowym w teorii gier jest pojęcie strategii. Rozumie się ją tu jako decyzję, w szczególnym
przypadku złożoną ze zbioru decyzji cząstkowych (wektor zmiennych decyzyjnych), ewentualnie
sekwencję decyzji, jakie gracz może podjąć. Pojęciu podjęcie decyzji odpowiada tu pojęcie wyboru
strategii
Tabela 2.1 ilustruje wzajemną zależność między pojęciami strategii i wypłaty dla dwóch
graczy - gracza A i gracza B. Jest to tzw. macierz wypłat. W macierzy tej zilustrowano wypłaty
zarówno gracza A, jak i gracza B. Gracze mają tu do wyboru po cztery strategie - gracz A
strategie a1 , a2 , a3 i a4 , gracz B natomiast strategie b1 , b2 , b3 i b4 . Jeśli gracz A wybierze strategię
ai , a gracz B strategię bj , to otrzymają oni w ten sposób wypłaty - odpowiednio VjA (ai ) i ViB (bj ).
W zależności od zakresu posiadanych informacji wyróżnić można gry o pełnej informacji (with
complete information – C-games) oraz gry o informacji niepełnej (with incomplete information
– I-games) [28, 29, 62, 63].
3
4
Tego typu gry nazywa się również grami o sumie stałej.
Grę powtarzalną traktować można jako wielokrotne rozgrywanie gry jednorazowej. Innym podejściem do
problemu wielokrotnie rozpatrywanych sytuacji growych są modele gier dynamicznych, czy ewolucyjnych [98].
2.2. MODELE GRY RYNKOWEJ NA KONKURENCYJNYM RYNKU TELEKOMUNIKACYJNYM
17
Tabela 2.1: Ilustracja pojęć strategia i wypłata.
b1
b2
b3
..
.
b4
......
......
[V3A (a2 ), V2B (b3 )]
..
.
..
.
......
a1
a2
a3
a4
2.2
Modele gry rynkowej na konkurencyjnym rynku telekomunikacyjnym
Model gry rynkowej na konkurencyjnym rynku telekomunikacyjnych został opracowany przez
Autora we wcześniejszych pracach [44, 47]. Dla jasności wywodów przeprowadzanych w tej pracy
zostanie on tu szczegółowo przedstawiony.
Na wstępie zidentyfikowane zostanie czemu w realnej sytuacji konkurencyjnej odpowiada
omawiane wcześniej pojęcie gry, kto jest w tej grze graczem, jakie ma do dyspozycji strategie
i jaką postać przybierają odpowiednie funkcje wypłat. Problemy te są wzajemnie powiązane.
Określenie czym jest gra rynkowa dokonuje się najpierw poprzez identyfikację samego rynku.
Następnie poprzez identyfikację funkcji wypłat, co implikuje konieczność określenia graczy, którym te funkcje odpowiadają. Określenie strategii wiąże się z identyfikacją zmiennych decyzyjnych
każdego z graczy, których wartość w sposób istotny wpływa na wartość funkcji wypłat.
2.2.1
Identyfikacja rynków
Identyfikacja rynku opiera się na kryterium oferowanego produktu lub usługi (kryterium przedmiotowe) oraz na wymiarze geograficznym, z uwzględnieniem kryterium podmiotowego, a niekiedy również i czasowego [3]. Właściwy rynek produktowy obejmuje te wszystkie towary i usługi,
które są uznawane przez konsumenta za wzajemnie wymienne lub substytucyjne ze względu na
ich właściwości, ceny i przeznaczenie. Definiowanie rynku w wymiarze geograficznym odwołuje
się do pojęcia konkurencji. Właściwy rynek geograficzny obejmuje obszar objęty działalnością
dostawców lub sprzedawców produktów, na którym warunki konkurencji są podobne lub jednolite. W sektorze telekomunikacyjnym wymiar geograficzny rynku determinowany jest przede
wszystkim obszarem sieci. I tak definiuje się rynki lokalne, regionalne, krajowe lub ponadnarodowe. Kryterium podmiotowe dzieli rynki telekomunikacyjne na detaliczne, związane ze świadcze-
18
niem usług użytkownikom końcowym oraz na rynki hurtowe, związane z zapewnianiem dostępu
do sieci innym przedsiębiorstwom telekomunikacyjnym. Kryterium czasowe dzieli rynki z punktu
widzenia okresu czasowego, w jakim świadczone są usługi.
Swoisty podział rynków dokonuje się również z racji na kształt regulacji prawnych, a ściślej
mówiąc na podział na tzw. regulację ex ante (regulację wyprzedzającą) i regulację ex post [70].
Dla przykładu podamy klasyfikację rynków podaną przez Komisję Europejską w rekomendacji 2003/311/EC [9]. Są to tzw. rynki właściwe, związane z wyznaczaniem pozycji przedsiębiorstwa, a w szczególności z identyfikacją przedsiębiorstwa o znaczącej pozycji rynkowej.
Rekomendacja wymienia:
• Na rynku detalicznym:
1. Rynek dostępu do abonentów domowych (residential ) o stałej lokalizacji w publicznej
sieci telefonicznej.
2. Rynek dostępu do abonentów biznesowych (non-residential ) o stałej lokalizacji w
publicznej sieci telefonicznej.
3. Rynek publicznie dostępnych usług telekomunikacyjnych na poziomie lokalnym i/lub
krajowym dla abonentów domowych o stałej lokalizacji.
4. Rynek publicznie dostępnych usług telekomunikacyjnych na poziomie międzynarodowym dla abonentów domowych o stałej lokalizacji.
5. Rynek publicznie dostępnych usług telekomunikacyjnych na poziomie lokalnym i/lub
krajowym dla abonentów biznesowych o stałej lokalizacji.
6. Rynek publicznie dostępnych usług telekomunikacyjnych na poziomie międzynarodowym dla abonentów biznesowych o stałej lokalizacji.
7. Rynek oferowania minimalnego zbioru łączy dzierżawionych.
• Na rynku hurtowym:
1. Rynek usług rozpoczęcia połączenia (call origination) w publicznej sieci telekomunikacyjnej, dostarczanych użytkownikom o stałej lokalizacji.
2. Rynek usług zakończenia połączenia (call termination) w publicznej sieci telekomunikacyjnej, dostarczanych użytkownikom o stałej lokalizacji.
3. Rynek usług tranzytu ruchu w stałej publicznej sieci telefonicznej.
4. Rynek hurtowego dostępu do uwolnionej metalowej pętli i podpętli abonenckiej dla
celów świadczenia szerokopasmowych i głosowych usług.
5. Rynek hurtowego szerokopasmowego dostępu do infrastruktury sieciowej.
19
6. Hurtowy rynek łączy dzierżawionych dla potrzeb zakończenia połączeń (Wholesale
terminating segments of leased lines).
7. Hurtowy rynek łączy dzierżawionych dla potrzeb tranzytowych (Wholesale trunk segments of leased lines).
8. Rynek dostępu i rozpoczęcia połączenia w publicznej ruchomej sieci telefonicznej.
9. Rynek usług zakończenia połączenia w ruchomej sieci telefonicznej.
10. Narodowy rynek hurtowy międzynarodowych usług roamingowych w publicznych
sieciach ruchomych.
11. Rynek usług transmisji rozsiewczej.
2.2.2
Identyfikacja graczy
Identyfikacja graczy w grze rynkowej zdaje się być zagadnieniem prostym. Graczami w grze
na danym rynku telekomunikacyjnym są przede wszystkim przedsiębiorstwa telekomunikacyjne
prowadzące na tym rynku działalność. Uwzględnić jednakże trzeba również istnienie tzw. rynków
wzajemnie powiązanych, czyli takich, że istnieje możliwość przenoszenia władzy rynkowej z jednego na drugi [70]. Dla przykładu decyzje co do wysokości taryf za usługi telekomunikacyjne
ustanawiane przez operatorów lokalnych mają istotny wpływ na wyniki, jakie osiągają operatorzy międzystrefowi i odwrotnie. I o ile w przypadku, gdy operator międzystrefowy jest podmiotem niezależnym względem operatorów lokalnych, wpływ na wyniki tych ostatnich będzie
zasadniczo podobny (efekty rozłożone względnie równomiernie), o tyle w przypadku, gdy operator międzystrefowy jest jednocześnie jednym z operatorów lokalnych, efekt ujęty całościowo
może być radykalnie różny5 .
Niejednoznaczną jest tu kwestia roli regulatora. Możliwym jest podejście, w którym regulatora traktuje się jako jednego z graczy, mającego dla danego rynku własny zbiór strategii
(możliwych do użycia instrumentów prawno-administracyjnych), oraz celów, związanych z realizowaną polityką, które traktować można jako punkty aspiracji w przestrzeni kryteriów oceny
stanu sytuacji rynkowej, czyli jego funkcji wypłat.
W innym ujęciu regulatora nie traktuje się jako jednego z graczy, lecz jako ograniczenie
na zbiór dopuszczalnych strategii działających na rynku przedsiębiorstw. To podejście, poparte
nota bene potocznym rozumieniem pojęcia gracz rynkowy, jest o tyle słuszne, iż w momencie
„rozgrywania gry” przepisy prawne są już (z reguły) ustalone, a wynikające z nich decyzje
regulatora w najgorszym przypadku łatwe do przewidzenia. W niniejszej pracy przyjmiemy to
drugie podejście.
5
Wiąże się to z problemem tzw. krossubsydiowania, czyli wspieraniem jednej, mniej dochodowej działalności
przez inną, bardziej dochodową.
20
2.2.3
Identyfikacja strategii
Postrzeganie usługi z punktu widzenia jej użytkownika, jak i podmiotu, który ją świadczy może
być bardzo różne. Użytkownik widzi usługę w jej formie finalnej, podczas gdy dostawca usługi
widzi jej elementy składowe. Wprowadźmy zatem następującą definicję:
Definicja 2.2.1 Jednostką usługową – SUAipm nazywamy elementarną część m usługi bądź
usług, świadczonych przez przedsiębiorstwo A, w i-tej strefie (np. strefie numeracyjnej), dla
użytkownika o profilu p, z którą związana jest pobierana od użytkownika opłata PAipm .
Jednostka usługowa jest pojęciem ogólnym (tak jak ogólnym jest pojęcie użytkownika [70]) i
dotyczyć może usług świadczonych zarówno na rynku detalicznym, jak i hurtowym. W szczególności jednostka usługowa może być samą usługą, jak to jest np. w przypadku usługi związanej z
zapewnieniem dostępu do sieci, z którą związana jest stała opłata abonamentowa lub też częścią usługi, jak to jest dla przykładu z usługą rozpoczęcia połączenia, która może wchodzić w
skład usługi połączenia, realizowanego między abonentami dwóch różnych sieci. Pojęcie jednostki usługowej może być również przypisane do usługi, z uwzględnieniem rozróżnienia na czas
jej świadczenia. Dla przykładu usługa lokalnego połączenia telefonicznego w godzinach szczytu stanowić może inną jednostkę usługową, niż ta sama usługa świadczona w godzinach poza
szczytem, jeśli tylko świadczący ją operator uwzględniał będzie możliwość ustalenia w obu przypadkach różnych cen6 .
Korzystając z powyższej definicji jednostki usługowej SUAipm oraz odpowiadającej jej ceny
PAipm zdefiniujemy pojęcie strategii:
j
)}.
Definicja 2.2.2 Strategią aj przedsiębiorstwa A nazywamy zbiór par {(SUAipm , PAipm
Zgodnie z definicją 2.2.2 strategia aj będzie strategią identyczną ze strategią ak wtedy i tylko
wtedy, gdy dla każdej jednostki usługowej SUAipm , zachodzić będzie zależność:
j
k
PAipm
= PAipm
Strategia aj będzie natomiast strategią różną od strategii ak , jeśli dla co najmniej jednej
jednostki usługowej SUAipm , zachodzić będzie zależność:
j
k
PAipm
6= PAipm
6
Chodzi tu o potencjalną możliwość ustalenia różnych cen, a nie o faktyczną ich różnicę.
2.2.4
21
Identyfikacja funkcji wypłaty
Funkcja wypłaty stanowi kryterium oceny wyniku gry, a zatem i kryterium oceny decyzji
(wybranej strategii), jaką podjął dany gracz. Takich kryteriów oceny może być bardzo wiele7 .
W niniejszej pracy ograniczymy się do czterech zasadniczych rodzajów kryteriów, bazujących
na modelu popytu na świadczone usługi i modelu ponoszonych przez przedsiębiorstwa kosztów.
Kryteria popytu i liczby użytkowników
Załóżmy istnienie modelu popytu na usługi telekomunikacyjne, składającego się z dwóch modeli
składowych8 :
XiY j
• Model funkcji popytu – DAputn
– wielkość ruchu przenoszonego przez sieć operatora A,
związanego z realizacją usługi u, w chwili czasowej t i dniu tygodnia n, generowanego przez
użytkownika o profilu p w i-tej strefie operatora X, w relacji połączenia z użytkownikiem
w j-tej strefie operatora Y .
• Model liczby użytkowników – UAip – liczba użytkowników o profilu p, korzystających z
usług przedsiębiorstwa A, w i-tej strefie numeracyjnej.
Dla modelu funkcji popytu w szczególnym przypadku może zachodzić:
• (X = Y = A) – dla ruchu zamykającego się w sieci operatora A (lokalnego, jeśli i = j i
międzystrefowego, jeśli i 6= j).
• (X = A 6= Y ) – dla ruchu rozpoczynającego się w i-tej strefie operatora A i kończącego
się w j-tej strefie operatora Y .
• (X 6= A = Y ) – dla ruchu rozpoczętego w i-tej strefie operatora X i kończącego się j-tej
strefie operatora A.
• (X 6= A 6= Y ) – dla ruchu wychodzącego z sieci operatora X i kierowanego do sieci
operatora Y , tranzytowanego przez sieć operatora A.
Modele powyższe mają charakter wyjść (outcomes), których wartości zależą (między innymi) od
przyjętych w modelu strategii, czyli cen za poszczególne jednostki usługowe. Dlatego też modele
te traktować można jako funkcje kryteriów oceny skutku wybranych przez graczy strategii.
Są to kryteria elementarne. Na ich podstawie zbudować można wiele różnorodnych kryteriów
zaagregowanych. Dla przykładu poniżej podajemy kilka spośród nich.
7
8
Teoretycznie nieskończenie wiele [74].
Przyczynek do powstania takiego modelu znaleźć można w pracy [?].
22
• Kryteria popytu
– Kryterium całkowitej wielkości ruchu, związanego z realizacją usługi u, generowanego
przez wszystkich użytkowników w i-tej strefie operatora A:
DAiu =
AiY j
DAputn
· UAip
XXX
Y,j
p
t,n
– Kryterium całkowitej wielkości ruchu zamykającego się w strefie i (ruch lokalny), sieci
operatora A (ruch generowany w relacji Ai − Ai):
DAiAi =
X
AiAi
DAputn
· UAip
p,u,t,n
– Kryterium całkowitego ruchu generowanego w i-tej strefie sieci operatora A i wychodzącego do j-tej strefy operatora B (ruchu generowanego w relacji Ai − Bj):
DAiBj =
AiBj
DAputn
· UAip
X
p,u,t,n
– Kryterium całkowitego ruchu przychodzącego z sieci operatora B do sieci operatora
A:
DBA =
BjAi
· UBjp
DBputn
X X
i,j p,u,t,n
– Kryterium całkowitego ruchu obsługiwanego w sieci przez operatora A w godzinach
szczytu (t = s), w dniach pracujących (n = w):
DAsw =
XX
AiAj
· UAip +
DApusw
XX
AiY j
· UAip +
DApusw
Y jAi
· UY jp
DBpusw
Y,j,i p,u
i,Y,j p,u
i,j p,u
XX
– Kryterium stosunku ruchu przychodzącego do wychodzącego w sieci operatora A,
połączonej z siecią operatora B:
T /O
DA
=
BjAi
X X DBputn
· UBjp
i,j p,u,t,n
AiBj
DAputn
· UAip
• Kryteria liczby użytkowników
– Kryterium liczby użytkowników o profilu p przedsiębiorstwa A:
UAp =
X
UAip
i
– Kryterium całkowitej liczby użytkowników przedsiębiorstwa A:
UA =
X
UAip
i,p
– Kryterium udziału w rynku użytkowników o profilu p przedsiębiorstwa A:
P
UAip
wzg
UAp = P i
X,j UXjp
23
Kryteria kosztów i zysków
Jedna z możliwych klasyfikacji dzieli ponoszone przez przedsiębiorstwa koszty na tzw. koszty
stałe, niezależne od wielkości produkcji (zakresu oferowanych usług) i na tzw. koszty zmienne, od
wielkości produkcji zależne [33, 65, 89]. Z racji na fakt, iż strategie graczy opierają się na cenach
za poszczególne jednostki usługowe, stąd też za kosztowe kryteria oceny wyniku gry przyjąć
należy te z funkcji kosztów, na których wartość (w sposób pośredni) te ceny mają wpływ. Będą
to zatem te spośród funkcji kosztów, które uzależnione są od wielkości przenoszonego ruchu oraz
od liczby użytkowników sieci. Dla przykładu mogą to być następujące koszty:
XiY j
• KAu
- koszt zmienny, ponoszony przez przedsiębiorstwo A, związany z przenoszeniem
ruchu dla celów realizacji usługi u w relacji Xi − Y j. Przy czym w szczególnym przypadku
może zachodzić:
– (X = Y = A) – dla ruchu zamykającego się w sieci operatora A (lokalnego, jeśli i = j
i międzystrefowego, jeśli i 6= j).
– (X = A 6= Y ) – dla ruchu rozpoczynającego się w i-tej strefie operatora A i kończącego
się w j-tej strefie operatora Y .
– (X 6= A = Y ) – dla ruchu rozpoczętego w i-tej strefie operatora X i kończącego się
j-tej strefie operatora A.
– (X 6= A 6= Y ) – dla ruchu wychodzącego z sieci operatora X i kierowanego do sieci
operatora Y , tranzytowanego przez sieć operatora A.
I
• KAip
– uśredniony koszt instalacji pojedynczego łącza abonenckiego dla użytkownika o
profilu p w i-tej strefie operatora A.
M - uśredniony koszt utrzymania pojedynczego łącza abonenckiego dla użytkownika o
• KAip
profilu p w i-tej strefie operatora A.
IBP OI
• KAl
– uśredniony koszt instalacji pojedynczego punktu połączeniowego POI, ponos-
zony przez operatora A łączącego swą sieć z siecią operatora B, na l-tym poziomie interconnectu9 .
M BP OI
• KAl
– uśredniony koszt utrzymania pojedynczego punktu połączeniowego POI (point
of interconnect), ponoszony przez operatora A połączonego z operatorem B, na l-tym
poziomie interconnectu.
9
Przez poziom interconnectu rozumiemy jeden z czterech możliwych przypadków: bezpośredni dostęp do
pętli abonenckiej (l = 0), połączenie na poziomie lokalnym (l = 1), połączenie na poziomie międzystrefowym
z pojedynczym tranzytem (l = 2), połączenie na poziomie międzystrefowym z podwójnym tranzytem (l = 3).
Połączenia międzynarodowe traktować można jako ostatni z wymienionych poziomów (l = 3).
24
Kryteria kosztowe definiować można dla poszczególnych jednostek usługowych, dla ich grup,
dla poszczególnych rynków, dla usług związanych z przenoszeniem ruchu w określonej relacji,
jak również w sensie całkowitego kosztu ponoszonego przez przedsiębiorstwo.
Zysk ZA przedsiębiorstwa A definiowany jest jako różnica osiąganych przez nie przychodów
RA , oraz ponoszonych kosztów KA .
ZA = RA − KA
Przychody czerpane są z wszelkiej działalności usługowej (z każdej jednostki usługowej SU ),
jaką przedsiębiorstwo prowadzi, a ich całkowita wartość wyraża się zależnością
RA =
X
DAipm · PAipm
i,p,m
gdzie DAipm jest ilością oferowanej jednostki usługowej SUAipm . Podobnie jak rzecz się ma w
przypadku kryteriów kosztowych, kryteria zysku definiować można dla poszczególnych jednostek
usługowych, dla ich grup, dla poszczególnych rynków, dla usług związanych z przenoszeniem
ruchu w określonej relacji, jak również w sensie całościowego wyniku finansowego przedsiębiorstwa.
Jakościowy podział kryteriów
W zależności od preferencji gracza (przyjętej polityki działania), każde z wyżej wymienionych
kryteriów może być maksymalizowane, minimalizowane lub stabilizowane10 . Każdy rodzaj kryterium sprowadzić można w sposób prosty do kryterium maksymalizowanego. Zachodzą bowiem
następujące zależności:
minimizef = maximize − f
oraz
stabilizef = maximize
1
ˆ
|f − f | + 1
gdzie fˆ jest wartością funkcji f , wokół której chcemy ją stabilizować.
2.3
Rodzaje gier na rynku telekomunikacyjnym i ich własności
Pojedyncze kryterium oceny wyniku gry rozpatrywane na danym rynku (np. kryterium maksymalizacji zysku czerpanego z telefonicznych usług lokalnych) definiuje nam jednokryterialną grę
rynkową. Liczba jednokryterialnych gier rynkowych odpowiada liczbie możliwych i rozsądnie
wybranych kryteriów oceny wybranej strategii. Z jednokryterialnych gier rynkowych możemy
10
Uzasadnienie tego stwierdzenia znaleźć można w pracach [44, 47].
2.3. RODZAJE GIER NA RYNKU TELEKOMUNIKACYJNYM I ICH WŁASNOŚCI
25
tworzyć gry wielokryterialne, dla których funkcja wypłaty jest wektorem, którego poszczególne
składowe stanowią kryteria oceny z gier jednokryterialnych [98].
Zgodnie z przyjętą klasyfikacją kryteriów dokonać możemy następującego podziału gier jednokryterialnych:
• Gry o wielkość ruchu
• Gry o liczbę użytkowników
• Gry o koszt
• Gry o zysk
Każda z gier posiada ten sam zbiór możliwych strategii gry11 . Gry te zatem są ze sobą powiązane i
decyzje podejmowane w ramach jednej gry wpływają na wyniki uzyskiwane w pozostałych grach.
Każdy z graczy rynkowych bierze udział w każdej z gier w tym sensie, że jego decyzje
(wybrane strategie) wpływają na wartości funkcji wypłat każdego z graczy w każdej grze.
Przyjęta polityka działania, a więc preferencje co do ważności poszczególnych kryteriów oceny,
wprowadzają tu pewien porządek – choć gracze biorą udział w każdej grze, to ich zainteresowanie
wynikami w każdej z gier może być różne. Powiemy zatem, że gracz gra w daną grę, jeśli jest
zainteresowany wynikami tej gry, czyli jeśli traktuje funkcję wypłaty z tej gry jako kryterium
(jedyne lub jedno z wielu) oceny wybranej przez siebie strategii. Funkcję wypłaty z gry, w którą
gracz gra nazwiemy kryterium istotnym dla gracza. Funkcje wypłat z gier, w które gracz nie gra
(choć bierze w nich udział) nazwiemy kryteriami nieistotnymi.
Dla poszczególnych rodzajów gier zachodzą następujące właściwości:
• Gry o wielkość ruchu – funkcje wypłaty oparte są na modelu popytu.
• Gry o liczbę użytkowników – funkcje wypłaty oparte są na modelu liczby użytkowników
(element modelu popytu).
• Gry o koszt – funkcje wypłaty oparte są na modelu kosztów i modelu popytu.
• Gry o zysk – funkcje wypłaty oparte są na modelu popytu i modelu kosztów.
11
Dotyczy to także gier wielokryterialnych.
26
Rozdział 3
Modelowe ujęcie ograniczeń
informacyjnych w grze rynkowej
3.1
Informacyjna reprezentacja graczy w grze
Przynajmniej teoretycznie rzecz ujmując, każdy z elementów przedstawionego w poprzednim
punkcie modelu gry rynkowej może być dla danego gracza nieznany. Każdy z elementów tego
modelu reprezentuje też różny zbiór zjawisk, faktów, właściwości charakteryzujących rynek, jak i
jego otoczenie. O ile więc te zjawiska, fakty i właściwości są dla danego gracza nieznane (o ile nie
posiada na ich temat informacji), a więc o ile stanowią źródło określonego rodzaju niepewności
czy ryzyka, o tyle też niepewne i obarczone ryzykiem będą i owe elementy modelu.
Generalnie gracz reprezentowany jest w przyjętym przez nas modelu przez grę, w którą gra,
a ściślej mówiąc przez funkcję wypłaty w tej grze, jak również dostępne w tej grze strategie
gry. Ponadto przyjąć można, iż reprezentowany jest również przez cel, do jakiego dąży, który
w najprostszym ujęciu może być indywidualnie efektywny (oparty wyłącznie na maksymalizacji
własnej funkcji wypłaty) lub antagonistyczny (oparty również na dążeniu do pogorszenia wypłaty
innych graczy. Ponadto gracz charakteryzowany jest przez informacje, jakie posiada na temat
elementów modelu reprezentujących jego samego, jak również innych graczy.
Warto zauważyć, że pomiędzy tymi elementami, reprezentującymi danego gracza w określonej
grze nie zachodzi ścisła rozłączność. Dla przykładu, można powiedzieć, że dany gracz reprezentowany jest przez strategie gry, jakie posiada tylko wówczas, gdy jest świadomy, gdy wie, czyli
gdy posiada informacje, że właśnie takie strategie gry są dla niego dostępne. Co więcej, świadomość dostępnych strategii gry jest dla danego gracze kompletnie bezużyteczna dopóki nie potrafi
ocenić skutków wybrania tych strategii, a więc dopóki nie zna postaci funkcji wypłaty. Jednakże
argumentami funkcji wypłaty danego gracza nie są tylko jego własne strategie gry, ale również
27
28
ROZDZIAŁ 3. MODELOWE UJĘCIE OGRANICZEŃ INFORMACYJNYCH W GRZE RYNKOWEJ
strategie innych graczy. Innymi słowy znajomość dostępnych własnych strategii gry, jak również
własnej funkcji wypłaty pozostaje dla gracza bezużyteczna, dopóki nie zna on możliwych strategii gry innych graczy, bowiem od nich uzależniona jest ostateczna ocena (czyli wartość funkcji
wypłaty) skutku wybrania określonej, własnej strategii. Co więcej, znajomość strategii gry innych
graczy zakłada w istocie świadomość liczby graczy biorących udział w danej grze.
Informacja na temat własnych strategii gry, własnej funkcji wypłaty oraz strategii gry innych
graczy (a w tym i liczby tych graczy) stanowi więc minimalny zbiór informacji, jaką musi posiadać dany gracz, aby mógł rozgrywać grę w sposób racjonalny, czyli aby był w stanie racjonalnie
oceniać skutki podejmowanych decyzji i działań. Nota bene dokładnie takie założenia czynione
są w ramach teorii decyzji w warunkach niepewności, o czym mowa była w rozdziale 1. Ten
minimalny zbiór informacji odpowiada w istocie znajomości własnej macierzy gry.
Minimalny zbiór informacji, a więc znajomość własnej macierzy gry pozwala danemu graczowi ocenić skutki wyboru różnych własnych strategii, w zależności od strategii wybranych
przez innych graczy. Nie jest to jednakże zbiór informacji wystarczający do wybrania właściwej strategii. Aby taką strategię wybrać, dany gracz musi jeszcze posiadać takie informacje,
które pozwolą mu przewidzieć lub w szczególnym przypadku poznać strategie, jakie wybiorą
inni gracze. Konieczna jest mu więc jeszcze informacja na temat ich macierzy wypłat. Co więcej,
z racji na fakt, że gracze podejmują swoje decyzje w oparciu o informację, którą posiadają, to by
móc przewidzieć te decyzje, dany gracz musi wiedzieć, jakie informacje posiadają inni gracze, w
szczególności zaś (choć nie jedynie, o czym za chwilę) wiedzieć, czy gracze ci znają jego macierz
wypłat.
Kolejną rzeczą (o czym już wspomniano), którą dany gracz musi poznać, by być w stanie
przewidzieć jaką strategię wybiorą inni gracze jest cel, do jakiego ci gracze dążą1 (indywidualnie efektywny lub antagonistyczny [42]). Założenie, że gracze Ci zawsze i wyłącznie dążą do
maksymalizacji własnej funkcji wypłaty (cel indywidualnie efektywny) może się okazać błędne.
Dla przewidzenia strategii gry, którą wybiorą inni gracze, a co się z tym wiąże właściwego
wyboru własnej strategii gry konieczna jest również znajomość kolejności ruchów w grze, czyli
kolejności w jakiej poszczególni gracze będą wybierali swoje strategie. Zasadniczo bowiem różna
kolejność determinuje wybór różnych strategii [49, 53].
Generalnie, gracze rozgrywają gry w różny sposób (wybierają rożne strategie) w zależności
od tego, czy jest to gra jednorazowa, czy rozgrywana wielokrotnie. Często w przypadku gier
jednorazowych wynik jest albo trudny do przewidzenia (jak to się dzieje np. w przypadku gry
chicken, w której są dwa rozwiązania równowagowe, a każdy z graczy chciałby wybrać inne), albo
łatwy do przewidzenia, ale nieefektywny (jak to jest np. w przypadku gry dylemat więźnia, w
1
Rzecz jasna za oczywistość należy przyjąć, że dany gracz zna cel, do którego sam dąży.
3.2. KLASYFIKACJA GIER ZE WZGLĘDU NA INFORMACYJNĄ REPREZENTACJĘ GRACZY
29
której dominujące strategie graczy prowadzą właśnie do takiego wyniku) [83, 90]. W przypadku
rozgrywania tego typu gier wielokrotnie gracze uczą się nawzajem swojego sposobu rozgrywania
gry, jak również po przez swój sposób grania komunikują innym graczom swoje intencje, co w
dłuższej perspektywie ustala określony sposób grania przez wszystkich graczy (często inny, niż
w przypadku rozgrywania tej gry w sposób jednorazowy). Dlatego też istotna dla graczy jest
informacja na temat, czy gra jest jednorazowa czy powtarzalna.
I wreszcie ostatnia rzecz, którą dany gracz musi widzieć na temat innych graczy, aby prawidłowo przewidzieć ich sposób rozegrania gry jest zakres informacji posiadanej przez tych graczy.
Gracze ci bowiem uzależniają wybór swojej strategii od przewidywanego sposobu rozegrania innych graczy, a w tym również danego gracza. Innymi słowy, gracz ten musi wiedzieć, co wiedzą
inni.
Podsumowując przyjąć możemy, że w danej grze gracz reprezentowany jest przez następujące
rodzaje informacji, którą posiada lub nie. Są to:
1. Informacja na temat własnej macierzy wypłat;
2. Informacja na temat macierzy wypłat innych graczy;
3. Informacja na temat celu do jakiego dążą inni gracze;
4. Informacja na temat kolejności ruchów graczy w grze (ewentualnie wybranych przez innych
graczy strategii, jeśli wykonywali ruch wcześniej);
5. Informacja o tym czy gra jest jednorazowa, czy powtarzalna;
6. Informacja na temat posiadanej informacji przez innych graczy (odnośnie każdego z wyżej
wymienionych elementów).
3.2
Klasyfikacja gier ze względu na informacyjną reprezentację
graczy
Z wcześniejszej analizy wynika, że ze względu na posiadaną informację gracz reprezentowany
jest przez sześć różnych zmiennych. Jeśli nawet założyć tylko, że każda ze zmiennych przyjmować może jedynie dwie wartości (co jest bez wątpienia założeniem silnie upraszczającym2 )
to i tak mielibyśmy 26 = 64 różne informacyjne reprezentacje danego gracza, a to w istocie
2
Podział binarny jest tu o tyle upraszczający, że nie uwzględnia informacji częściowych. I tak sytuacja częś-
ciowej znajomości macierzy wypłat danego gracza jest bez wątpienia sytuacją inną, niż sytuacja całkowitej znajomości lub nieznajomości tejże macierzy.
30
oznacza tyleż samo różnych rodzajów gier, które dla pełnego wyczerpania tematu analizy ich informacyjnych aspektów należałoby rozważyć. Dlatego też pożądanym jest poszukiwanie jakiegoś
bardziej ogólnego podejścia, jakiejś klasyfikacji, która pozwoli na istotne zredukowanie liczby
przypadków wymagających osobnej analizy.
Ścieżka w tym względzie została już przetarta przed bez mała 40-tu laty przez John’a C.
Harsanyi [28, 29, 62, 63], za co nota bene otrzymał później nagrodę Nobla. Szczegółowo metoda,
którą zaproponował Harsanyi do analizy gier z ograniczeniami informacyjnymi została przedstawiona w rozdziale 4 niniejszej pracy. W tym miejscu przybliżymy jedynie jej podstawowe
założenia, a co się z tym wiąże ograniczenia, co pozwoli nam na dokonanie ogólnej klasyfikacji
gier z ograniczeniami informacyjnymi i wskazanie kierunku dalszych badań.
Harsanyi wprowadza pojęcie typu gracza. Typ gracza określa jego macierz wypłat, cel do
jakiego dąży, jak również informacje, jakie posiada. Każdy gracz może być reprezentowany
przez wiele typów (gracze mogą mieć różne macierze wypłat, różne cele i różną wiedzę), jednakże w danym przypadku, w określonej grze każdy z graczy reprezentowany jest tylko przez
jeden z możliwych dla niego typów. Typ ten nazwany jest aktywnym typem w grze. Każdy z
graczy wie, jakiego jest typu (który z jego typów jest typem aktywnym). Nie wie jednakże,
jakiego typu są inni gracze. Harsanyi zakłada, że powszechnie dostępna jest informacja na temat prawdopodobieństwa, że dany gracz jest określonego typu (że dany typ określonego gracza
jest typem aktywnym). W oparciu o tę informację (informację na temat prawdopodobieństw, że
poszczególni gracze są określonych typów), jak również informację na temat tego, jaki typ aktualnie reprezentuje danego gracza w grze (który z jego typów jest typem aktywnym), gracz określa
prawdopodobieństwo (prawdopodobieństwo warunkowe), że inni gracze są reprezentowani przez
konkretne ich typy. W oparciu o te prawdopodobieństwa, jak również własną funkcję użyteczności (funkcję wypłaty, która jest mu znana z racji na znajomość własnego typu), gracz ten definiuje
nową funkcję użyteczności (tzw. semi-warunkową funkcję użyteczności ), która definiuje nową grę,
która jak dowodzi Harsanyi jest już grą z pełną informacją.
Harasnyi zakłada ponadto, że gracze wykonują ruchy jednocześnie, a więc właściwym rozwiązaniem
tej nowej gry jest po prostu jedno z rozwiązań równowagowych w sensie Nasha [64].
Ta krótka charakterystyka podejścia zastosowanego przez Harsanyi pokazuje, że uwzględnia
ono przypadki, w których dany gracz może lecz nie musi nie posiadać:
• Informacji na temat macierzy wypłat innych graczy;
• Informacji na temat celu do jakiego dążą inni gracze;
• Informacji na temat posiadanej informacji przez innych graczy (odnośnie każdego z wyżej
wymienionych elementów).
3.2. KLASYFIKACJA GIER ZE WZGLĘDU NA INFORMACYJNĄ REPREZENTACJĘ GRACZY
31
Kwestie te zostają zawarte w pojęciu typu gracza. Harsanyi zakłada natomiast, że dany gracz zna
swoją macierz wypłat oraz, że gracze wykonują ruchy jednocześnie. Naturalnym dopełnieniem
podejścia Harsanyi do gier z niepełną informacją będą więc następujące przypadki:
• Dany gracz nie zna swojego typu i nie zna typu innych graczy;
• Dany gracz nie zna swojego typu i zna typ innych graczy;
Podejcie Harsanyi i przyjęte przez niego założenie znajomości własnego typu i nieznajomości
typu innych graczy powodowało przekształcenie oryginalnej gry z niepełną informacją w grę z
pełną informacją, jednakże z inną niż w pierwotnej grze, semi-warunkową funcją użyteczności.
Należy się więc spodziewać, że wyżej wymienine dwa uzupełnijące przypadki różnić się będą
od pierwotnego jedynie postacią tych funkcji. Sam zaś model gry pozostanie niezmienny, jak
również niezmiennym pozostanie sposób jej rozwiązania (poszukiwanie równowagi Nasha).
Powyższe dwa przypadki należy więc jeszcze uzupełnić o przypadek sekwencyjnej kolejności ruchów, jak również o przypadek gry powtarzalnej3 . Oba te przypadki różnić się będą od
przyjętego przez Harsanyi sposobem ich rozwiązywania (nie będzie to już poszukiwanie równowagi Nasha), sama zaś struktrura gry wynikać będzie z właściwej dla posiadanych informacji o typach graczy postaci funkcji użyteczności (normalnej lub semi-warunkowej). Szczegółowo mowa
jest o tym w rozdziale
3
W swoje pracy Harsanyi zakłada rozgrywanie gry jednorazowej.
32
Rozdział 4
Gry z niepełną informacją w ujęciu
J. C. Harsanyi
4.1
Wprowadzenie
Niniejszy rozdział został opracowany na bazie prac [28, 29, 62, 63].
4.1.1
Teoria gier i klasyczna ekonomia
Teoria gier to teoria strategicznych interakcji. Innymi słowy, jest to teoria racjonalnego zachowania w sytuacjach społecznych, w których każdy z graczy musi wybrać własny ruch (własną
strategię) w oparciu o przypuszczenia odnośnie potencjalnego ruchu pozostałych graczy.
Teoria gier, jako systematyczna teoria datuje swój początek na rok 1944, kiedy to von Neumann i Morgenstern publikują Theory of Games and Economic Behavior. Jednym z głównych
obszarów zainteresowania nowej teorii była refleksja nad grami strategicznymi typu szachy czy
poker. Jednakże twierdzenia wyprowadzone na bazie tych gier okazały się definiować również
racjonalne zachowania w realnych sytuacjach ekonomicznych, politycznych i społecznych.
W zasadzie każda sytuacja społeczna wywołuje strategiczne interakcje pomiędzy jej uczestnikami. Stąd można by argumentować, że do właściwego zrozumienia jakiejkolwiek sytuacji
społecznej koniecznym jest przeprowadzenie analizy z użyciem narzędzi teorii gier. Jednakże
teoria klasycznej ekonomii zdaje się omijać aspekty charakterystyczne dla teorii gier w analizie
zagadnień ekonomicznych zachowań poprzez postulat konkurencji doskonałej, tj. założenia, że
każdy nabywca i każdy sprzedawca jest bardzo mały, w porównaniu z rozmiarem całego rynku i w
ten sposób żaden z uczestników rynku nie może swoimi decyzjami znacząco wpłynąć na aktualne
ceny rynkowe. Zgodnie z tym, dla każdego podmiotu biorącego udział w grze rynkowej, ceny,
za które może nabywać lub sprzedawać produkty są dane, z góry – przez mechanizm rynkowy
33
34
ROZDZIAŁ 4. GRY Z NIEPEŁNĄ INFORMACJĄ W UJĘCIU J. C. HARSANYI
– ustalone. To założenie przekształca jego problem decyzyjny odnośnie wielkości nabywanych
i sprzedawanych produktów w jedno-osobowy prosty problem maksymalizacji, który rozwiązać
można z pominięciem analizy właściwej dla teorii-gier.
Jednakże von Neumann i Morgenstern uświadomili sobie, że dla większości systemów ekonomicznych, założenie istnienia doskonałej konkurencji jest nierealistyczne. Większość przemysłów bowiem jest zdominowana przez małą liczbę dużych firm, a pracownicy organizują się
w różnego rodzaju związki zawodowe. Co więcej administracja centralna i wiele innych agencji
rządowych na wielu rynkach odgrywa rolę istotnych graczy jako potencjalni nabywcy a czasem i
sprzedawcy, jako regulatorzy czy podmioty ustanawiające wysokość podatków czy subsydiów. To
sprawia, że teoria gier stała się definitywnie istotnym narzędziem rozumienia i funkcjonowania
w obecnych systemach ekonomicznych.
4.1.2
Problem niekompletnej informacji
Podążając za von Neumann’em i Morgenstern’em wyróżnić możemy dwa rodzaje gier:
• Gry z pełną informacją (complete information), które nazywać będziemy C-grami (Cgames);
• Gry z niepełną informacją (incomplete information), które nazywać będziemy I-grami (Igames).
Druga z gier różni się od pierwszej tym, że gracze, lub co najmniej część z nich nie posiada
pełnej informacji na temat podstawowej struktury matematycznej, zdefiniowanej czy to postaci
normalnej, czy ekstensywnej.
Jednakże choć von Neumann i Morgenstern uczynili rozróżnienie pomiędzy C-grą i I-grą, ich
teoria (i praktycznie wszystkie prace w zakresie teorii gier do 1960 roku) była ograniczona do
analizy C-gier.
Brak informacji na temat matematycznej struktury gry może przybierać różne formy. Gracze
mogą nie posiadać pełnej informacji na temat funkcji wypłaty innych graczy (a nawet własnej),
na temat fizycznych i społecznych zasobów, na temat strategii dostępnych innym graczom (w
tym również sobie), na temat informacji posiadanych przez innych graczy odnośnie różnych
aspektów gry itd.
Jednakże, poprzez właściwe modelowanie, wszystkie formy niepełnej informacji mogą zostać
zredukowane do przypadku, kiedy to gracze nie posiadają pełnej informacji na temat funkcji
wypłaty – Ui każdego z graczy1 , definiującej wypłaty (utility payoff ) ui = Ui (s) każdego z graczy
1
W niniejszym rozdziale przyjmujemy konwencje zapisu stosowaną w oryginale przez J.C. Harsanyi, w szczegól-
ności w wykładzie z okazji przyznania mu nagrody Nobla [29].
4.2. DWU-OSOBOWA I-GRA
35
i dla każdej możliwej kombinacji strategii s = (s1 , . . . , sn ), wybranej przez n graczy biorących
udział w grze.
4.2
4.2.1
Dwu-osobowa I-gra
Model bazujący na przypuszczeniach coraz wyższego rzędu
Rozważmy dwu-osobową I-grę G, w której gracze nie znają nawzajem własnych funkcji wypłaty.
(Dla uproszczenia zakładamy jednak, że gracze znają własne funkcje wypłaty).
Bardzo naturalnym – jednakże, jak to wkrótce się okaże raczej niepraktycznym – sposobem
analizowania tego typu gry może być następujący sposób rozumowania: gracz 1 uświadamia
sobie, że strategia s2 gracza 2 będzie zależna od jego własnej (gracza 2) funkcji wypłaty U2 .
Dlatego też zanim zdecyduje się na wybór swojej własnej strategii s1 , gracz 1 tworzy pewne
przypuszczenie e1 U2 odnośnie natury funkcji wypłaty U2 gracza 2. Na tej samej zasadzie, gracz
2 formułuje pewne przypuszczenie e2 U1 odnośnie natury funkcji wypłaty U1 gracza 1. Te dwa
przypuszczenia e1 U2 oraz e2 U 1 nazwiemy przypuszczeniami pierwszego rzędu.
Następnie gracz 1 tworzy przypuszczenie drugiego rzędu e1 e2 U 1 odnośnie przypuszczenia
pierwszego rzędu e2 U1 gracza 1, natomiast gracz A tworzy przypuszczenie drugiego rzędu e2 e1 U2
odnośnie przypuszczenia pierwszego rzędu e1 U2 gracza 1 itd.
Oczywiście jeśli obaj gracze chcą kontynuować to Bayesowskie podejście wówczas ich przypuszczenia przybiorą formę subiektywnego rozkładu prawdopodobieństwa na odpowiednich obiektach matematycznych. W ten sposób, przypuszczenie pierwszego rzędu e1 U2 gracza 1 przybierze
formę subiektywnego rozkładu prawdopodobieństwa P11 (U2 ) na wszystkich możliwych postaciach funkcji U2 , które gracz 2 może posiadać. Podobnie, przypuszczenie pierwszego-rzędu e2 U1
gracza 2 przyjmie postać subiektywnego rozkładu prawdopodobieństwa P21 (U1 ) na wszystkich
możliwych postaciach funkcji U1 , którą gracz 1 może posiadać.
Z drugiej strony przypuszczenie drugiego rzędu e1 e2 U1 gracza 1 przyjmie formę subiektywnego rozkładu prawdopodobieństwa P12 (P21 ) na wszystkich możliwych rozkładach prawdopodobieństwa P21 jakie może przyjąć gracz 2. Ujmując rzecz bardziej ogólnie, przypuszczenie k-tego rzędu (k > 1), któregokolwiek z graczy i będzie subiektywnym rozkładem prawdopodobieństwa Pik (Pjk−1 ) na wszystkich przypuszczeniach (k-1)-go rzędu Pjk−1 , które drugi
gracz j (j 6= i) mógłby przyjąć.
Oczywiście jakikolwiek model, bazujący na przypuszczeniach coraz wyższego rzędu, będzie
komplikował się jeszcze bardziej, jeśli graczy będzie więcej niż dwóch (n-osobowa I-gra). Nawet
jeśli zachowamy upraszczające założenie, że każdy z graczy zna swoją własną funkcję wypłaty,
to i tak każdy z graczy będzie musiał sformułować (n − 1) różnych przypuszczeń pierwszego
36
rzędu, (n − 1)2 przypuszczeń drugiego rzędu i tak dalej.
Istnieje jednakże znacznie prostsze i bardziej właściwe podejście do analizy I-gier, oparte
jedynie na jednym rozkładzie prawdopodobieństwa P r (w połączeniu z n różnymi rozkładami
prawdopodobieństw warunkowych, z których każde otrzymuje się na podstawie rozkładu P r).
4.2.2
Negocjacje pomiędzy Stanami Zjednoczonymi a Związkiem Radzieckim,
odnośnie kontroli zbrojeń
W latach 1965-69 J.C. Harsanyi, wraz z grupą około 10 specjalistów od teorii gier został zatrudniony przez Agencję Kontroli Zbrojeń i Rozbrojenia w Stanach Zjednoczonych, jako konsultant w procesie redukcji zbrojeń i związanych z tym negocjacji pomiędzy USA i Związkiem
Radzieckim. Istotnym problemem w tych negocjacjach był fakt, że każda ze stron była względnie
dobrze poinformowana odnośnie swojej własnej sytuacji, z uwzględnieniem różnych zmiennych
związanych z tymi negocjacjami, takimi jak cele polityki, nasycenie postawą pokojową lub wojowniczą względem drugiej strony negocjacji, siła militarna, zdolność to wprowadzenia nowych
technologii militarnych itd. – a zarazem raczej słabo poinformowana odnośnie sytuacji drugiej
strony, w szczególności charakterystyki tych zmiennych. Odnalezienie właściwej reprezentacji
matematycznej tego szczególnego problemu, było krytycznym kluczem do stworzenia lepszej teorii
negocjacji dotyczącej kontroli zbrojeń jak również lepszej teorii dotyczącej I-gier2 . Podejście J.C.
Harsanyi do rozwiązania tego problemu było następujące.
Strona amerykańska oznaczona została jako gracz 1, strona radziecka jako gracz 2. Dla
zamodelowania niepewności gracza rosyjskiego odnośnie prawdziwej natury gracza amerykańskiego,
tj. gracza 1, Harsanyi założył istnienie K różnych możliwych typów gracza 1, oznaczonych odpowiednio: t11 , t21 , . . . , tk1 , . . . , tK
1 . Gracz rosyjski, tj. gracz 2 nie wie, który z poszczególnych typów
gracza 1 aktualnie reprezentuje stronę amerykańską w grze.
Ten fakt (niewiedza odnośnie aktualnego typu gracza amerykańskiego, gracza 1) stanowi
dla gracza rosyjskiego istotny problem z tego powodu, że jego własne strategiczne możliwości w danej grze w oczywisty sposób zależą, często nawet bardzo mocno, od tego, przeciwko
któremu z poszczególnych typów gracza amerykańskiego przychodzi mu grać w tej grze. Każdemu z K możliwych typów gracza amerykańskiego może odpowiadać radykalnie inna kombinacja możliwych charakterystyk tego gracza, w tym charakterystyka jego intencji, zdolności lub
niezdolności do wdrożenia nowych technologii militarnych, które w szczególnych przypadkach
2
Podobne problemy występują również w konkurencyjnych działaniach o charakterze ekonomicznym, jak
również w wielu innych działaniach o charakterze społecznym. Dla przykładu firmy biznesowe niemalże zawsze
są lepiej poinformowane odnośnie wartości zmiennych ekonomicznych związanych z ich własną działalnością niż
z działalnością konkurentów.
37
mogą radykalnie różnić się od przewidywanych przez stronę rosyjską. Co więcej, różne typy
gracza Amerykańskiego mogą się różnić pomiędzy sobą w zakresie przewidywań (przypuszczeń)
odnośnie prawdziwej natury gracza rosyjskiego.
Analogicznie, dla zamodelowania niepewności gracza amerykańskiego odnośnie prawdziwej
natury gracza rosyjskiego, tj. gracza 2, Harsanyi zakłada istnienie M różnych możliwych typów
M
gracza 2: t12 , t22 , . . . , tm
2 , . . . , t2 . Gracz amerykański, tj. gracz 1, nie wie który z poszczególnych
typów gracza 2 aktualnie reprezentuje stronę rosyjską w grze.
Ten fakt stanowi dla gracza amerykańskiego istotny problem, ponieważ każdy z M możliwych
typów gracza rosyjskiego może określać bardzo różne kombinacje możliwych charakterystyk
gracza rosyjskiego. Co więcej, różne typy gracza rosyjskiego mogą różnić się między sobą w
zakresie przewidywań (przypuszczeń) odnośnie prawdziwej natury gracza amerykańskiego.
4.2.3
Interpretacja I-gier skupiona na typach graczy
C-gry, tj. gry z pełną informacją są zawsze analizowane z założeniem, że centrum aktywności w
grze są biorący w niej udział gracze. W przypadku I-gier, tj. gier z niepełną informacją istnieje
swoboda wyboru pomiędzy dwoma alternatywnymi podejściami. Jedno z podejść zakłada, że
centrum aktywności są gracze, jak to miało miejsce w C-grach. Drugie zakłada, że centrum aktywności stanowią różne typy tych graczy. Pierwsze z podejść Harsanyi określa jako interpretację
skupioną na graczach (player-centered interpretation), drugie jako interpretację skupioną na typach (type-centered interpretation). Jeśli tylko obie interpretacje użyte są poprawnie to są one
zawsze ekwiwalentne z punktu widzenia teorii gier. Jednakże, zdaniem Harsanyi interpretacja
skupioną na typach dostarcza bardziej wygodnego języka do analizy I-gier3 .
Przy założeniu interpretacji skupionej na typach, w przypadku gdy gracz 1 jest typu tk1 , wówczas strategie i wypłaty gracza 1 są opisywane jako strategie i wypłaty tego typu tk1 gracza 1. Ten
język posiada tę zaletę, że umożliwia formułowanie stwierdzeń odnośnie typu tk1 , bez konieczności
czynienia dalszych kwalifikacji, podczas gdy analogiczne stwierdzenia odnośnie gracza 1 wymagałoby dodatkowego tłumaczenia, że to stwierdzenie dotyczy go wówczas, gdy jest on typu tk1 .
Stosowanie tego języka czyni zarazem użyteczne przypomnienie, że w dowolnej I-grze strategia,
którą dany gracz stosuje i wypłata jaką otrzymuje, zależy od tego, jakiego jest on typu. Oczywiście należy pamiętać, że jakiekolwiek stwierdzenie dotyczące danego typu tk1 , może zawsze być
przetłumaczone na język podejścia skupionego na graczach, poprzez założenie, że dotyczy ono
gracza 1 wówczas, gdy jest on typu tk1 .
W analogiczny sposób można definiować język skupiony na typach odnośnie gracza 2, gdy
3
W swoich pierwszych pracach na ten temat, opublikowanych w latach 1967-68 Harsanyi stosował podejście
skupione na graczach (player-centered ).
38
jest on typu tm
2 .
4.2.4
Dwa aktywne typy i ich funkcje wypłaty
Załóżmy, że gracz 1 jest typu tk1 , natomiast gracz 2 jest typu tm
2 . Przy takim założeniu możemy
powiedzieć, że ci dwaj gracze są reprezentowani przez swoje typy tk1 i tm
2 oraz, że są to typy
0
0
aktywne w grze. Dla odmiany, wszystkie typy tk1 takie, że k 0 6= k i wszystkie typy tm
2 takie, że
m0 6= m będziemy nazywali typami nieaktywnymi.
W dwuosobowych C-grach, wypłaty któregokolwiek z graczy zależą jedynie od strategii
wybranych przez każdego z graczy. Dla odmiany, w dwuosobowych I-grach wypłaty v1k i v2m
k
m
dwóch aktywnych typów tk1 i tm
2 zależą nie tylko od strategii s1 i s2 (czystych lub mieszanych)
wybranych przez te typy, ale również od ich typów, jak na to wskazują indeksy górne k i m w
k
m
symbolach tk1 i tm
2 oznaczających te je. Stąd wypłaty v1 i v2 zdefiniować można w następujący
sposób:
v1k = V1k (sk1 , sm
2 ; k, m)
(4.1)
v2m = V2m (sk1 , sm
2 ; k, m)
(4.2)
gdzie V1k i V2m oznacza funkcje wypłaty odpowiednio typu tk1 i tm
2 .
Harsanyi nazywa funkcje V1k i V2m warunkowymi funkcjami wypłaty z tego względu, że wypłata typy tk1 przyjmie wartość v1k zdefiniowaną zależnością 4.1 jedynie wówczas, gdy tk1 jest aktywnym typem w grze, a drugim aktywnym typem w tej grze jest tm
2 . Podobnie, wypłata typu
m
m
tm
2 przyjmie wartość v2 , zdefiniowaną zależnością 4.2 jedynie wówczas, gdy t2 jest aktywnym
typem w grze i drugim aktywnym typem jest tk1 .
Ściślej mówiąc, jeśli którykolwiek z typów tk1 lub tm
2 byłby nieaktywnym typem, wówczas
nie byłby on uczestnikiem tej gry i stąd, nie otrzymywałby żadnej wypłaty (lub otrzymywałby
wypłatę równą zero).
4.2.5
Zakres posiadanej wiedzy w grze
Dla wygody, Harsanyi zakłada, że matematyczna forma obu funkcji wypłat V1k i V2m są znane
każdemu z uczestników gry. Innymi słowy, funkcje te są znane każdemu graczowi i każdemu z
typów tych dwóch graczy.
Harsanyi zakłada również, że gracz 1 wie który z typów tk1 reprezentuje go w grze. Podobnie,
gracz 2 wie przez którego z typów tm
2 jest reprezentowany. Jednakże, w celu zamodelowania
niepewności każdego z graczy odnośnie prawdziwej natury drugiego gracza, Harsanyi zakłada,
że żaden z graczy nie wie przez który z typów reprezentowany jest drugi gracz.
39
W języku skupionym na typach, te założenia oznaczają, że każdy z typów obu graczy wie,
że jest aktywny, jeśli w rzeczywistości jest. Co więcej, typy te potrafią się zidentyfikować (dla
przykładu typ t31 wie, że jest typem t31 itd.). Dla odmiany, żaden z typów gracza 1 nie wie, który
z typów gracza 2 jest aktywny (i nie potrafi go zidentyfikować), jak też żaden z typów gracza 2
nie wie, który z typów gracza 1 jest aktywny.
4.2.6
Dwa istotne rozróżnienia
Jak już to można było zauważyć, istnieje jedna istotna różnica pomiędzy grami z pełną (complete) i grami z niepełną (incomplete) informacją, tj. pomiędzy C-grami i I-grami. Różnica ta
dotyczy ilości informacji posiadanej przez graczy odnośnie podstawowej struktury matematycznej
gry (czy to w jej postaci normalnej czy ekstensywnej). Innymi słowy, różnica dotyczy ilości posiadanej informacji, którą gracze posiadają przed rozpoczęciem gry.
W C-grach wszyscy gracze posiadają pełną informację na temat podstawowej struktury
matematycznej gry, która tę grę definiuje. Dla odmiany w I-grach, wszyscy gracze lub conajmniej
kilku z nich posiada jedynie informację częściową.
Inna, z pozoru podobna, choć jednakże zupełnie inna różnica zachodzi pomiędzy grami z
grami z doskonałą (perfect) i niedoskonałą (imperfect) informacją. To rozróżnienie bazuje na
ilości informacji, jaką gracze posiadają odnośnie sposobu rozgrywania gry – odnośnie ruchów
(moves), które zostały wykonane – we wcześniejszych fazach rozgrywania gry, tj. odnośnie
pewnych zdarzeń, które zaszły w trakcie rozgrywania gry, nie zaś przed jej rozpoczęciem.
W grach z doskonałą informacją, wszyscy gracze posiadają pełną informację na temat
wydarzeń (ruchów) z każdego z wcześniejszych etapów rozgrywania gry. Dla odmiany, w grach
z niedoskonałą informacją, gracze (wszyscy lub niektórzy) posiadają jedynie jedynie częściową
lub żadną informację odnośnie wcześniejszych etapów gry.
W tym sensie szachy i warcaby zaklasyfikować można do gier z doskonałą informacją, z
tej racji, że umożliwiają graczom obserwację nie tylko własnych ruchów, ale również ruchów
drugiego gracza.
Dla odmiany, większość gier z użyciem kart należy do gier z niedoskonałą informacją, ponieważ
gry te nie umożliwiają graczom obserwacji kart jakie otrzymują inni gracze, lub jakich się pozbywają, jeśli odkładają je w sposób utajniony.
Teoria gier, od czasu von Neumann’a i Morgenstern’a, aż do późnych lat 60-tych XX wieku
zajmowała się głównie grami z pełną (complete) informacją, klasyfikując wszystkie rozpatrywane
gry do jednej grupy niezależnie od tego, czy były to gry z doskonałą czy niedoskonałą informacją.
40
4.2.7
Model probabilistyczny I-gry G
Do tego momentu rozważaliśmy aktualne typy obu graczy, reprezentowane przez aktywną parę
(tk1 , tm
2 ) po prostu jako daną. Aktualnie wzbogacimy nasz model gry poprzez dodanie pewnych
formalnych współczynników odzwierciedlających przyczynę, że gracz amerykański i rosyjski posiadają charakterystykę opisaną przez (powiedzmy) typy tk1 i tm
2 . Przyczyny te, w tym konkretnym
przypadku odzwierciedlają oddziaływanie różnych sił społecznych, zlokalizowanych w Stanach
Zjednoczonych i Związku Radzieckim, jak również przypuszczalnie w innych częściach świata.
Ddoświadczenie pokazuje, że skutki działania nawet dokładnie określonych sił społecznych
można przewidywać jedynie z pewnym prawdopodobieństwem. Dlatego też Harsanyi wprowadza
losowy mechanizm, a ściślej mówiąc loterię, dla wyrażenia w sposób formalny skutku działania
określonych sił społecznych, które doprowadzają do tego, że strona tak strona amerykańska jak
i rosyjska jest reprezentowana w grze przez określony typ: odpowiednio tk1 i tm
2 .
Precyzyjniej mówiąc, Harsanyi zakłada, że zanim jeszcze jakikolwiek ruch zostanie wykonany
w grze G, pewna loteria L wybiera tk1 jako typ reprezentujący gracza amerykańskiego i tm
2 , jako
typ reprezentujący gracza rosyjskiego. Harsanyi zakłada przy tym, że znane jest prawdopodobieństwo wyboru określonej pary typów (tk1 , tm
2 ):
P r(tk1 , tm
2 ) = pkm
k = 1, . . . , K; m = 1, . . . , M.
(4.3)
Jako, że gracz 1 posiada K różnych możliwych typów, a gracz 2 – M różnych typów, to loteria L posiada wybór pomiędzy H = K · M różnymi parami postaci (tk1 , tm
2 ). Stąd też, dla
scharakteryzowania tej loterii potrzeba H różnych prawdopodobieństw pkm .
Oczywiście, każde z H prawdopodobieństw przyjmuje wartość od 0 do 1, a wszystkie sumują
się do jedności. Co więcej tworzą one swoistą macierz prawdopodobieństw [pkm ] o wymiarach
K × M , taką, że dla każdej możliwej wartości k i m, k-ty wiersz koresponduje z typem tk1 gracza
1, a m-ta kolumna koresponduje z typem tm
2 gracza 2.
Harsanyi zakłada, że każdy z graczy stara się dokonać estymacji tych H prawdopodobieństw,
w oparciu o posiadaną informację na temat odpowiednich sił społecznych, używając do tego
jedynie informację dostępną dla każdej ze stron. W istocie, gracze mogą estymować te prawdopodobieństwa w sposób w jaki czyniłby to zewnętrzny obserwator, posiadający iformację
wspólną dla obu graczy. Co więcej, Harsanyi zakłada, że każdy z graczy zakłada, że drugi z
graczy estymuje te prawdopodobieństwa pkm w ten sam sposób co on (tzw. common priors
assumption).
Alternatywnie założyć po prostu można, że obaj gracze przyjmują, że każdy z graczy zna
prawdziwą numeryczną wartość tych prawdopodobieństw pkm .
Matematyczny model gry, który otrzymaliśmy po dodaniu loterii L do dwuosobowej I-gry,
41
Harsanyi nazywa modelem probabilistycznym tej I-gry G. Jak to za chwilę zobaczymy, ten probabilistyczny model przekształca tę I-grę G w C-grę, czyli grę z pełną informacją, którą nazwiemy
grą G∗ .
4.2.8
Przekształcenie I-gry G z niepełną (incomplete) informacją w grę G∗ z
pełną (complete) ale niedoskonałą (imperfect) informacją
W tym punkcie posługiwali będziemy się językiem skupionym na graczach (player-centered ) z
tej racji, że w tym języku wyrażone są tradycyjne sformułowania dla gier z pełną i niepełną, jak
też doskonałą i niedoskonałą informacją.
Powróćmy do dwu-osobowej gry G, użytej przez nas jako model negocjacji odnośnie redukcji
zbrojeń pomiędzy Stanami Zjednoczonymi a Związkiem Radzieckim. Teraz możemy lepiej zrozumieć dlaczego, przy naszych pierwotnych założeniach odnośnie gry G, dlaczego jest to gra z
niepełną informacją.
(i) Przede wszystkim, zgodnie z naszymi pierwotnymi założeniami, gracz 1 jest typu tk1 ,
co możemy określić jako Fakt I, podczas gdy gracz 2 jest typu tm
2 , co określimy jako Fakt II.
Co więcej, zarówno Fakt I jak i Fakt II, zaistniały na samym początku gry i nie wynikają z
jakichkolwiek ruchów wykonanych w trakcie rozgrywania gry. W konsekwencji, oba fakty muszą
być rozważane jako części składowe podstawowej struktury matematycznej tej gry G.
(ii) Z drugiej strony, zgodnie z przyjętym wcześniej założeniem, gracz 1 zna Fakt I, ale nie
wie nic na temat Faktu II. Analogicznie, gracz 2 zna Fakt II, jednakże nic nie wie na temat
Faktu I.
Ponieważ zarówno Fakt I jak i Fakt II należą do podstawowej matematycznej struktury gry,
dlatego też ani gracz 1 ani gracz 2 nie posiada pełnej informacji na temat tej struktury i dlatego
gra G jest grą z niepełną informacją.
Teraz pokażemy, że reinterpretacja gry G zgodnie z wprowadzonym wcześniej modelem probabilistycznym (poprzez dodanie loterii L do gry G), przekształca tę grę w nową grę G∗ , która jest
grą z pełną informacją. Oczywiście, nawet po tej reinterpretacji, stwierdzenie zawarte w punkcie
(ii) pozostanie prawdziwe. Jednakże status Faktu I i Faktu II, jak to sformułowano w punkcie (i)
ulegnie radykalnej zmianie. Oba fakty staną się teraz rezultatami losowego wyboru dokonanego
przez loterię L w trakcie rozgrywania gry i dlatego nie będą już stanowić części matematycznej
struktury gry. W konsekwencji założenie, że żaden z graczy nie zna obu tych Faktów, nie czyni
już tej nowej gry G∗ grą z niepełną informacją. Wręcz przeciwnie, nowa gra G∗ będzie grą z
pełną informacją z tego powodu, że jego matematyczna struktura zdefiniowana jest przez model
probabilistyczny, który jest dobrze i w pełni znany każdemu z graczy.
Z kolei, prawdziwość stwierdzenia (ii) odnośnie naszej nowej gry G∗ , wyraża się w tym, że
42
każdy z graczy posiada jedynie częściową informację odnośnie pary (tk1 , tm
2 ), będącej rezultatem
losowego wyboru dokonanego przez loterię L na samym początku gry. Wybór dokonany przez
loterię L należy więc do historii rozgrywanej gry G∗ (nie zaś do jej podstawowej matematycznej
struktury, która jest niezmienna w trakcie rozgrywania gry), a więc z racji na niepełną informację
o tej historii wypada nam ją określić jako grę z niedoskonałą (imperfect) informacją. Dlatego
też gra G∗ jest grą z pełną (complete) ale niedoskonałą (imperfect) informacją.
4.2.9
Warunkowe prawdopodobieństwa w grze G∗
Przypuśćmy, że loteria L wybrała tk1 jako reprezentanta gracza 1 w grze. Stąd, zgodnie z
poczynionymi wcześniej założeniami, typ tk1 wie, że jest typem aktywnym i wie, że jest typem
tk1 . Jednakże typ ten nie wie jaki inny typ (drugiego gracza) jest aktywny w tej grze.
W jaki sposób typ tk1 może teraz określić prawdopodobieństwo, że drugim aktywnym typem w
grze jest teraz typ tm
2 gracza 2? Może i musi tego dokonać w oparciu o informacje, które posiada,
tzn. w oparciu o informację, że on, typ tk1 jest typem aktywnym. Oznacza to, że musi on określić
poszukiwane prawdopodobieństwo, jako prawdopodobieństwo warunkowe:
pkm
k
.
π1k (m) = P r(tm
2 |t1 ) = PK
k=1 pkm
(4.4)
Załóżmy teraz, że loteria L wybrała typ tm
2 jako reprezentanta gracza 2 w rozpatrywanej
grze. W jaki sposób teraz typ tm
2 może określić prawdopodobieństwo, że drugim aktywnym typem
jest typ tk1 gracza 1? Analogicznie rozumując, winien określić to prawdopodobieństwo jako prawdopodobieństwo warunkowe:
pkm
.
π2m (k) = P r(tk1 |tm
2 ) = PM
m=1 pkm
4.2.10
(4.5)
Semi-warunkowa funkcja wypłaty dwu aktywnych typów w grze
Załóżmy, że aktywne są w grze dwa typy tk1 i tm
2 . Jak była o tym wcześniej mowa wartości wypłat
v1k i v2m tych dwóch aktywnych typów zdefiniwane są przez zależności (4.1 i) i (4.2).
Warto zauważyć, jednakże, że wypłata v1k zdefiniowane zależnością (4.1) nie jest tą wartością,
którą typ tk1 stara się zmaksymalizować wybierając strategię sk1 . Wynika to z faktu, że typ tk1
k
nie wie, że jego aktualnym kontrpartnerem w grze jest typ tm
2 . Typ t1 wie jedynie, że jego
kontrpartnerem w grze będzie jeden z M typów gracza 2. Dlatego też, typ tk1 będzie wybierał
strategię sk1 w celu zabezpieczenia swoich interesów nie w odniesieniu tylko do swojego nieznanego
sobie aktualnego kontrpartnera tm
2 ale raczej w odniesieniu do wszystkich M typów gracz 2,
ponieważ wszystko, co typ tk1 wie, to to, że każdy z nich może aktualnie być his kontrpartnerem
w grze.
43
Jednakże typ tk1 wie, że prawdopodobieństwo, że drugim aktywnym typem w grze jest typ tm
2
równe jest warunkowemu prawdopodobieństwu π1k (m) zdefiniowanego zależnością (4.4). Stąd też
wielkością, którą typ tk1 będzie starał się zmaksymalizować jest wartość oczekiwana uk1 wypłaty
v1k , którą wyrazić można w sposób następujący:
M
X
uk1 = U1k (sk1 , s∗2 ) =
π1k (m) · V1k (sk1 , sm
2 ; k, m).
(4.6)
m=1
Symbol s∗2 oznacza tu wektor M strategii:
M
s∗2 = (s12 , s22 , . . . , sm
2 , . . . , s2 ).
(4.7)
Symbol s∗2 został wprowadzony, jako drugi argument funkcji U1k w celu pokazania, że wartość
oczekiwana wypłaty uk1 typu tk1 zależy nie tylko od strategii sm
2 , którą jego aktualny i nieznany
1
M
mu kontrpartner tm
2 stosuje, ale raczej od zbioru (wektora) strategii s2 , . . . , s2 , które dowolny
z jego M potencjalnych kontrpartnerów t12 , . . . , tM
2 mógłby zastosować w sytuacji, gdyby został
wybrany przez loterię L jako kontrpartner typy tk1 w rozpatrywanej grze.
Analogiczne rozumując wielkością, którą typ tm
2 będzie chciał maksymalizować, wybierając
m
swoją strategię sm
2 , nie będzie jego wypłata v2 zdefiniowana zależnością (4.2), lecz raczej będzie
m
nią wartość oczekiwana um
2 tej wypłaty v2 , zdefiniowana zależnością:
m ∗ m
um
2 = U2 (s1 , s2 ) =
K
X
π2m (k) · V2m (sk1 , sm
2 ; k, m).
(4.8)
k=1
Symbol s∗1 oznacza tu wektor K strategii:
s∗1 = (s11 , s21 , . . . , sk1 , . . . , sK
1 ).
(4.9)
I w tym miejscu, symbol s∗1 został wprowadzony jako pierwszy argument funkcji U2m w celu
1
K
wskazania, że wartość oczekiwana wypłaty typu tm
2 zależy od wszystkich K strategii s1 , . . . , s1 ,
którą każdy z K typów gracza 1 mógłby wybrać w przypadku, gdyby był wybrany przez loterię
L jako kontrpartner typu tm
2 w rozpatrywanej grze.
Dla odróżnienia od warunkowych funkcji wypłaty V1k i V2m , użytych w zależnościach (4.1) i
(4.2), funkcje wypłaty U1k i U2m użyte w zależnościach (4.6) i (4.8) Harsanyi określa jako semiwarunkowe (semi-conditional ).
Funkcje V1k i V2m definiują wypłaty v1k lub v2m odpowiedniego typu jako zależne od dwóch
warunków :
(a) Dany typ musi mieć status typu aktywnego i
(b) Drugi aktywny typ w grze musi być określonym typem drugiego gracza.
44
Dla odmiany, funkcje U1k i U2m definiują wartość oczekiwaną wypłaty uk1 i um
2 odpowiedniego
typu jako niezależne od warunku (b) a zarazem zależne od warunku (a). Wynika to stąd, że
żaden z typów nie otrzyma wypłaty w ogóle, jeśli nie został wybrany przez loterię L jako typ
aktywny w grze.
Jak o tym była już wcześniej mowa, reinterpretacja oryginalnej I-gry G poprzez wprowadzenie dla niej modelu probabilistycznego, doprowadziło do tego, że I-gra G stała się w istocie C-grą,
którą oznaczyliśmy jako G∗ . Zgodnie z interpretacją skupioną na typach (type-center interpretation), ta C-gra G∗ może być rozpatrywana jako (K+M)-osobowa gra, w której rzeczywistymi
„graczami” będą K typów gracza 1 i M typów gracza 2, z ich podstawowymi funkcjami wypłaty
będącymi semi-warunkowymi funkcjami wypłaty U1k (k = 1, . . . , K) i U2m (m = 1, . . . , M ).
Jeśli będziemy rozpatrywali te (K+M) typów jako rzeczywistych „graczy” w grze G∗ oraz
funkcje wypłaty U1k i U2m jako ich rzeczywiste funkcje wypłaty, wówczas w sposób prosty możemy
określić równowagę Nash’a w tej C-grze G∗ . Wówczas, stosując odpowiednią teorię wyboru
równowag, możemy określić jedną z nich jako rozwiązanie tej gry.
4.3
4.3.1
N-osobowa I-gra
Typy różnych graczy, aktywny zbiór, i właściwe zbiory w n-osobowej
I-grze
Analiza dwu-osobowych I-gier może być w sposób prosty rozszerzona do n-osobowych I-gier.
Ograniczymy się jednakże w tym miejscu jedynie do najważniejszych kwestii związanych z grami
n-osobowymi.
Załóżmy, że N oznacza zbiór wszystkich n graczy. Załóżmy, że każdy gracz i (i = 1, . . . , n)
i
posiada Ki różnych możliwych typów, które oznaczymy jako t1i , . . . , tki , . . . , tK
i . Stąd całkowita
liczba różnych typów w grze wynosi:
Z=
X
Ki .
(4.10)
i∈N
Załóżmy, że gracze 1, . . . , i, . . . , n są aktualnie reprezentowani w grze przez swoje aktywne typy
tk11 , . . . , tki i , . . . , tknn . Zbiór aktywnych n typów Harsanyi nazywa zbiorem aktywnym i oznacza
jako ā.
Jakikolwiek zbiór n typów zawierający dokładnie jeden typ każdego z n graczy może w zasadzie pełnić rolę zbioru aktywnego. Każdy taki zbiór nazwiemy zbiorem właściwym (appropriate
set). Jako, że dowolny gracz i posiada Ki różnych typów, liczba różnych zbiorów właściwych w
grze wynosi:
H=
Y
i∈N
Ki .
(4.11)
45
4.3. N-OSOBOWA I-GRA
Przyjmijmy, że tych H zbiorów właściwych zostanie ponumerowane i oznaczone jako:
a1 , a2 , . . . , ah , . . . , aH .
(4.12)
Przyjmijmy, że Aki będzie rodziną wszystkich zbiorów właściwych zawierających w sobie jako
członka konkretny typ tki pewnego gracza i. Liczba różnych zbiorów właściwych w rodzinie Aki
wyniesie:
Y
a(i) =
H
.
Ki
Kj =
j∈N,j6=i
(4.13)
Oznaczmy przez Bik zbiór wszystkich indeksów h takich, że ah należy do rodziny Aki . Ponieważ
istnieje zależność jeden do jednego pomiędzy elementami zbioru Aki i elementami zbioru Bik stąd
też, zbiór Bik posiada a(i) różnych elementów.
4.3.2
Niektóre prawdopodobieństwa
Załóżmy, iż zanim jakikolwiek ruch zostanie wykonany w grze G∗ , pewna loteria L wybiera jeden
szczególny zbiór właściwy a i czyni go zbiorem aktywnym ā w grze. Wszystkie n typów w tym
zbiorze ā są typami aktywnymi, podczas gdy wszystkie pozostałe typy nie należące do zbioru
aktywnego ā są typami nieaktywnymi.
Przyjmijmy, że prawdopodobieństwo, że konkretny zbiór właściwy ah został wybrany przez
loterię L jako zbiór aktywny ā w tej grze wynosi:
P r(ā = ah ) = rh
dla
h = 1, . . . , H.
(4.14)
Oczywiście każde z tych H prawdopodobieństw rh jest nieujemne i wszystkie sumują się do
jedności. Są to analogiczne prawdopodobieństwa, do prawdopodobieństw pkm (zdefiniowanych
zależnością (4.3)), które wprowadzone zostały dla gier dwu-osobowych.
Przypuśćmy, że pewien konkretny typy tki gracza i został wybrany przez loterię L jako aktywny typ w tej grze. Wówczas, zgodnie z uczynionymi założeniami, typ ten wie, że jest typem tki
i wie, że jest typem aktywnym. Innymi słowy, tki wie, że:
tki ∈ ā.
(4.15)
Ze stwierdzenia, że tki ∈ ā, czyli, że typ tki należy do zbioru aktywnego wynika stwierdzenie,
że ten zbiór aktywny ā należy do rodziny zbiorów właściwych Aki zawierających ten typ. Stąd
mamy:
ā ∈ Aki
(4.16)
i odwrotnie, ponieważ Aki zawiera dokładnie te zbiory właściwe, których członkiem jest aktywny
typ tki , to zachodzi również implikacja w drugą stronę. Stąd zapisać możemy:
(tki ∈ ā) ⇐⇒ (ā ∈ Aki ).
(4.17)
46
Powiedzieliśmy wcześniej, że jeśli tki jest typem aktywnym wówczas typ ten wie, że zachodzi
(4.15). Teraz możemy dodać do tego jeszcze stwierdzenie, że typ ten wie, że zachodzi (4.16)
i (4.17). W sposób prosty typ ten może obliczyć prawdopodobieństwo, że loteria L wybierze
aktywny zbiór ā jako należący do rodziny Aki :
P r(ā ∈ Aki ) =
X
rh .
(4.18)
h∈Bik
W kontekście zależności od (4.15) do (4.18) można zapytać, w jaki sposób typ tki może określić
prawdopodobieństwo, że aktywnym zbiorem ā wybranym przez loterię L jest aktualnie konkretny
zbiór ah ? Odpowiedź jest prosta: jako prawdopodobieństwo warunkowe:
πik (h) = P r(ā = ah |tki ∈ ā).
(4.19)
W kontekście zależności od (4.17) do (4.18) otrzymujemy:
P r(ā = ah |tki ∈ ā) = P r(ā = ah |ā ∈ Aki ) =
P r(ā = ah )
rh
.
=P
k
P r(ā ∈ Ai )
h∈B k rh
(4.20)
.
(4.21)
i
W konsekwencji (4.19) i (4.20) otrzymamy zależność:
πik (h) = P
rh
h∈Bik rh
4.3.3
Profile strategii
Ki
1
k
i
Załóżmy, że Ki typów gracza i: t1i , . . . , tki , . . . , tK
i wybrałoby strategie si , . . . , si , . . . , si (czyste
lub mieszane) w przypadku, gdyby zostały wybrane przez loterię L jako aktywne typy w grze4 .
Wprowadzimy zależność:
i
s∗i = (s1i , . . . , ski , , sK
i )
dla
i = 1, . . . , n
(4.22)
dla oznaczenia profilu strategii 5 Ki typów gracza i. Niech
s∗ = (s∗i , . . . , s∗n )
(4.23)
będzie uporządkowanym zbiorem, który otrzymujemy wówczas gdy zestawimy ze sobą w kolejności K1 strategii z profilu s∗1 , następnie K2 strategii z profilu s∗2 ,. . . , następnie Ki strategii z
4
Zgodnie z wcześniejszym założeniem, nieaktywne typy nie uczestniczą aktywnie w grze i stąd nie wybierają
żadnej strategii gry.
5
W swoich oryginalnych pracach (lata 60te XX wieku) Harsanyi używa w tym miejscu pojęcia strategii
znormalizowanej. Pojęcie profilu strategii pojawia się w późniejszym opracowaniu [29].
47
4.3. N-OSOBOWA I-GRA
profilu s∗i ,. . . i na koniec Kn strategii z profilu s∗n . Oczywiście, s∗ oznacza profil strategii wszystkich typów w rozpatrywanej grze. Korzystając z zależności (4.10), wyznaczającej całkowitą liczbę
różnych typów w grze możemy powiedzieć, że profil s∗ zawiera Z różnych strategii.
I na koniec oznaczmy przez s∗ (h) profil strategii n typów należących do konkretnego zbioru
właściwego ah , gdzie h = 1, . . . , H.
4.3.4
Warunkowe funkcje wypłaty
Niech ah będzie zbiorem właściwym zdefiniowanym w następujący sposób:
ah = (tk11 , . . . , tki i , . . . , tknn ).
(4.24)
Wprowadzimy pojęcie wektora charakterystycznego c(h) dla zbioru ah , który będzie zbiorem
(wektorem) indeksów typów ki poszczególnych graczy i, należących do zbioru właściwego ah :
c(h) = (k1 , . . . , ki , . . . , kn ).
(4.25)
Załóżmy, że ten zbiór ah został wybrany przez loterię L jako aktywny zbiór ā w grze oraz, że
pewien konkretny typ tki gracza i został wybrany przez loterię L jako typ aktywny. Oczywiście
oznacza to, że typ tki musi być członkiem zbioru właściwego ah , co zachodzi jedynie wówczas,
gdy typ tki jest identyczny z typem tki i użytym w zależności (4.24), co w praktyce oznacza k = ki .
Jeśli te zależności zachodzą, wówczas zbiór ah oraz typ tki wspólnie spełniają zależności od
(4.14) do (4.21).
Jak to stwierdziliśmy w trakcie analizy gier dwu-osobowych, wypłaty vik aktywnego typu tki
zależą od dwóch rzeczy:
1. od strategii wybranych przez każdego z n aktywnych typów w grze oraz
2. od tożsamości (identities) tych aktywnych typów.
To oznacza jednakże, że wypłata vik typu tki zależy od profilu strategii s∗ (h) (uwzględnienie strategii) zdefiniowanego w poprzednim punkcie oraz od wektora charakterystycznego c(h) (uwzględnienie tożsamości) zdefiniowanego zależnością (4.25).
Stąd też możemy zapisać następującą zależność:
vik = Vik (s∗ (h), c(h))
if
tki ∈ ā = ah .
(4.26)
Funkcję wypłaty Vik (i = 1, . . . , k; k = 1, . . . , Ki ) Harsanyi określa jako warunkowa funkcja
wypłaty. Nazwa ta uzasadniona jest z dwóch powodów. Po pierwsze, jakikolwiek typ otrzyma
wypłatę vik zdefiniowaną zależnością (4.26) jedynie wówczas, gdy zostanie wybrany przez loterię
48
L jako aktywny typ w tej grze (wyraża to zależność tki ∈ ā w równaniu (4.26)). Po drugie, nawet
jeśli tki zostanie wybrany jako aktywny typ w grze, zależność (4.26) definiuje jego wypłatę vik
jedynie wówczas, gdy loteria L wybierze zbiór właściwy ah jako aktywny zbiór ā w grze (wyraża
to zależność ā = ah w równaniu (4.26)).
4.3.5
Semi-warunowe funkcje wypłaty
Rozumując w sposób analogiczny jak w przypadku gier dwu-osobowych, stwierdzić można, że
określony aktywny typ tki nie będzie dążył do maksymalizacji wypłaty vik zdefiniowanej zależnością (4.26), tylko wartości oczekiwanej uki tej wypłaty vik . Korzystając z wcześniejszych ustaleń,
uki zdefiniować możemy w sposób następujący:
uki = Uik (s∗ ) =
H
X
πik (h) · Vik (s∗ (h), c(h))
if
tki ∈ ā.
(4.27)
h=1
Funkcję Uik (i = 1, . . . , n; k = 1, . . . , Ki ) Harsenyi nazywa semi-warunkową (semi-conditional )
z tego względu, że funkcja ta uzależniona jest od pierwszego z warunków dotyczących funkcji
warunkowej Vik (tki ∈ ā), jednakże nie jest uzależniona od warunku drugiego (ā = ah ). Innymi
słowy, jakikolwiek typ tki otrzyma oczekiwaną wypłatę uki zdefiniowaną zależnością (4.27) jedynie
wówczas, gdy jest aktywnym typem w grze. Jednakże jeśli tki jest aktywnym typem w grze,
wówczas jego oczekiwana wypłata uki nie zależy od tego, czy konkretny zbiór właściwy ah został
uprzednio wybrany przez loterię L jako aktywny zbiór ā w grze.
Również i dla gier n-osobowych prawdziwym jest stwierdzenie, że jeśli określona I-gra G
zostanie zreinterpretowana poprzez wprowadzenie modelu probabilistycznego, wówczas gra ta
staje się w istocie C-grą G∗ .
Co więcej, ta C-gra G∗ , przy założeniu interpretacji skupionej na typach (type-centered interpretation), może być rozważana jako Z-osobowa gra, w której „graczami” jest grupa Z różnych
typów w grze. Za funkcje wypłaty tych „graczy” możemy przyjąć semi-warunkowe funkcje
wypłaty Uik . Korzystając z tych funkcji Uik możemy w sposób prosty zdefioniować równowagi Nasha w tej Z-osobowej grze, a następnie w oparciu o stosowną teorię wyboru rozwiązań
równowagowych wybrać jedno z nich jako rozwiązanie całej gry.
Rozdział 5
Gry z niepełną informacją –
uzupełnienie podejścia
J. C. Harsanyi
5.1
Wprowadzenie
W oparciu o przeprowadzoną w rozdziale 1 analizę ograniczeń informacyjnych, jakim podlegają
uczestnicy realnych gier rynkowych możemy stwierdzić, że przyjęte przez J.C. Harsanyi założenie,
że dany gracz wie, który z typów jest jego własnym aktywnym typem w grze (patrz rozdział 4)
jest założeniem zbyt silnym dla pełnego opisu tych gier. W istocie bowiem w wielu przypadkach
gracze nie posiadają pełnej informacji na temat popytu na świadczone przez siebie usługi, czy
modelu ponoszonych przez siebie kosztów, a więc nie są wstanie precyzyjnie określić własnej
funkcji wypłaty. Często nie mają też pewności, które ze strategii są dla nich dostępne (np. nie
wszystkie spotkają się z akceptacją ze strony regulatora). Tym bardziej też nie mają pewności,
które ze strategii dostępne są dla innych graczy. Innymi słowy, gracze często nie mają pewności
na temat tego, jak w rzeczywistości wygląda ich macierz wypłat.
W ramach analizy przeprowadzonej w rozdziale 3 stwierdziliśmy, że dla uzupełnienia podejścia zaproponowanego przez J.C Harsanyi należy rozważyć jeszcze dwa przypadki:
1. Dany gracz nie zna swojego typu i nie zna typu innych graczy;
2. Dany gracz nie zna swojego typu i zna typ innych graczy.
W następnym punkcie niniejszego rozdziału zajmiemy się ich analizą, która doprowadzi nas do
sformułowania funkcji wypłaty graczy w każdym z przypadków.
49
ROZDZIAŁ 5. GRY Z NIEPEŁNĄ INFORMACJĄ – UZUPEŁNIENIE PODEJŚCIA
J. C. HARSANYI
50
5.2
Dany gracz nie zna swojego typu
Różnica pomiędzy dwoma wyżej wymienionymi przypadkami dotyczy znajomości bądź nieznajomości typu innych graczy. Przypomnijmy, że wprowadzone przez J.C. Harsanyi określenie typu
gracza określa jego pełną charakterystykę, w tym jego funkcję wypłaty, możliwe strategie gry,
cele, posiadaną informację, stosunek do ryzyka itp. Harsanyi zakłada, że każdy z graczy zna
pełną charakterystykę wszystkich możliwych typów każdego z graczy, w tym prawdopodobieństwo, że dany typ jest typem aktywnym w grze, jak również wie w sposób pewny, który z jego
typów jest typem aktywnym. W analizie, którą przeprowadzimy w tym punkcie rozluźnimy to
ostatnie założenie, tzn. dany gracz nie będzie wiedział, który z jego typów jest typem aktywnym.
Zanim przejdziemy do analizy i formułowania funkcji wypłaty graczy w tych dwóch, uzupełniających przypadkach, przypomnimy w skrócie istotę podejścia przyjętego przez Harsanyi.
5.2.1
Streszczenie podejścia Harsanyi
2-osobowa I-gra
Harsanyi zakłada istnienie K różnych możliwych typów gracza 1, oznaczonych odpowiednio:
1 2
m
M
t11 , t21 , . . . , tk1 , . . . , tK
1 , oraz M różnych typów gracza 2 oznaczonych: t2 , t2 , . . . , t2 , . . . , t2 . Przy
tym znane jest prawdopodobieństwo P r(tk1 , tm
2 ) = pkm , że na początku gry loteria L wybiera
określoną parę (tk1 , tm
2 ) jako aktywną parę typów w grze.
P r(tk1 , tm
2 ) = pkm
k = 1, . . . , K; m = 1, . . . , M.
(5.1)
Każdy z typów graczy posiada określoną (i znaną każdemu z graczy) funkcję wypłaty, określającą
wartość jego wypłaty:
v1k = V1k (sk1 , sm
2 ; k, m)
(5.2)
v2m = V2m (sk1 , sm
2 ; k, m)
(5.3)
gdzie V1k i V2m oznacza funkcje wypłaty odpowiednio typu tk1 i tm
2 . Są to funkcje warunkowe,
tzn., że funkcja V1k jest funkcją wypłaty gracza 1 wówczas, gdy jego aktywnym typem w grze
(typem reprezentującym tego gracza w grze) jest typ tk1 , a drugim aktywnym typem w grze jest
m
typ tm
2 (analogicznie odnośnie funkcji V2 ).
Każdy z graczy wie, który typ, jest jego typem aktywnym. W oparciu o tę wiedzę oraz
o wiedzę na temat prawdopodobieństw, że loteria L wybiera określoną parę typów aktywnych,
każdy z graczy może określić prawdopodobieństwo (prawdopodobieństwa warunkowe), że drugim
aktywnym typem w grze jest określony typ drugiego gracza. I tak gracz 1, wiedząc, że jego aktywnym typem w grze jest typ tk1 , oraz, że loteria L wybiera parę (tk1 , tm
2 ) z prawdopodobieństwem
51
5.2. DANY GRACZ NIE ZNA SWOJEGO TYPU
pkm , określa prawdopodobieństwo π1k (m), że drugim aktywnym typem w grze jest typ tm
2 zgodnie
z zależnością:
pkm
k
.
π1k (m) = P r(tm
2 |t1 ) = PK
k=1 pkm
(5.4)
W oparciu o te prawdopodobieństwa (5.4) jak również warunkowe funkcje wypłaty (5.2), gracz
1 definiuje nową (semi-warunkową) funkcję wypłaty U1k postaci:
M
X
uk1 = U1k (sk1 , s∗2 ) =
π1k (m) · V1k (sk1 , sm
2 ; k, m).
(5.5)
m=1
gdzie s∗2 oznacza tu wektor M strategii:
M
s∗2 = (s12 , s22 , . . . , sm
2 , . . . , s2 ),
(5.6)
która jest jego funkcją wypłaty w grze, która jest już grą z pełną informacją (C-gra).
Analogicznie gracz 2, znając prawdopodobieństwo pkm oraz wiedząc, że jego aktywnym
m
typem jest typ pm
2 określa prawdopodobieństwo π2 (k), że aktywnym typem gracza 1 jest typ
tk1 i o parciu o to prawdopodobieństwo i warunkową funkcję wypłaty (5.3) definiuje nową (semiwarunkową) funkcję postaci:
m ∗ m
um
2 = U2 (s1 , s2 ) =
K
X
π2m (k) · V2m (sk1 , sm
2 ; k, m).
(5.7)
k=1
gdzie s∗1 oznacza tu wektor K strategii:
s∗1 = (s11 , s21 , . . . , sk1 , . . . , sK
1 ),
(5.8)
która jest jego funkcją wypłaty w grze, która jest już grą z pełną informacją (C-gra).
W interpretacji skupionej na typach, wprowadzony model probabilistyczny przekształcił oryginalną dwu osobową I-grę G w (K+M)-osobową C-grę G∗ . „Graczami” w tej C-grze jest K
typów gracza 1 i M typów gracza 2 z funkcjami wypłat zdefiniowanymi zależnościami (5.5) i
(5.7).
Rozwiązaniem tej gry, z racji na założoną jednoczesność wykonywania ruchów przez graczy
jest jedna z równowag Nash’a, czyli taki łączny zbiór strategii:
0
0
0
0
0
0
0
0
0
0
0
1
2
m
M
s = (s∗1 , s∗2 ) = (s11 , s21 , . . . , sk1 , . . . , sK
1 , s2 , s2 , . . . , s2 , . . . , s2 ), (5.9)
dla którego zachodzą następujące zależności [98]:
0
0
0
U1k (sk1 , s2∗ ) U1k (sk1 , s∗2 )∀sk1 , ∀k = 1, . . . K.
0
0
0
m ∗
m
m
U2m (s∗1 , sm
2 ) U2 (s1 , s2 )∀s2 , ∀m = 1, . . . M.
(5.10)
(5.11)
J. C. HARSANYI
52
N-osobowa I-gra
Harsanyi zakłada, że każdy gracz i (i = 1, . . . , n) posiada Ki różnych możliwych typów, które
i
oznacza jako t1i , . . . , tki , . . . , tK
i . Każdy z n graczy może być reprezentowany w grze przez jeden
ze swoich typów. Taki zbiór typów, których liczba odpowiada liczbie graczy, a przy tym każdy
typ reprezentuje innego gracza Harsanyi nazywa zbiorem właściwym i oznacza jako ah . Każdy z
typów tki gracza i, posiada znaną każdemu z graczy warunkową funkcję wypłaty
vik = Vik (s∗ (h), c(h)),
(5.12)
gdzie s∗ (h) jest zbiorem strategii, wybieranych przez typy (graczy reprezentowanych przez te
typy) należące do zbioru właściwego ah , natomiast c(h) jest tzw. wektorem charakterystycznym
dla zbioru ah (do którego należy m.in.typ tki ), który jest zbiorem indeksów typów ki poszczególnych graczy i, należących do zbioru właściwego ah :
c(h) = (k1 , . . . , ki , . . . , kn ).
(5.13)
Zbiór aktywny ā to taki zbiór właściwy, w którym każdy z typów jest aktywnym typem
danego gracza. Harsanyi zakłada, że na początku gry loteria L może wybrać określony zbiór
właściwy ah jako zbiór aktywny ā z prawdopodobieństwem rh :
P r(ā = ah ) = rh
dla
h = 1, . . . , H.
(5.14)
Gracz i wie, że jego aktywnym typem w grze jest typ tki , czyli, że typ ten należy do zbioru
aktywnego ā. Ten fakt pozwala mu oszacować prawdopodobieństwo tego, że pozostali gracze są
reprezentowani przez konkretne ich typy, czyli że dany zbiór właściwy ah jest zbiorem aktywnym.
Jest to prawdopodobieństwo warunkowe:
πik (h) = P r(ā = ah |tki ∈ ā) = P
rh
h∈Bik rh
,
(5.15)
gdzie Bik jest zbiorem indeksów h, takich, że zbiór właściwy ah należy do rodziny wszystkich
zbiorów właściwych zawierających w sobie typ tki (rodzina Aki ).
W oparciu o to prawdopodobieństwo, oraz warunkową funkcję wypłaty typ tki wyznacza
swoją nową (semi-warunkową) funkcję wypłaty postaci:
uki = Uik (s∗ ) =
H
X
πik (h) · Vik (s∗ (h), c(h))
if
tki ∈ ā,
(5.16)
h=1
która definiuje już grę z pełną informacją (C-grę). Rozwiązaniem tej gry, z racji na założoną
jednoczesność wykonywania ruchów przez graczy jest jedna z równowag Nash’a
5.2.2
53
Dany gracz nie zna swojego typu i zna typ innych graczy
Ten przypadek, przypadek, w którym dany gracz nie zna swojego typu, natomiast zna typ innych graczy może się wydawać nieco dziwaczny, jednakże na gruncie teoretycznym nie można
go odrzucić. A i przypuszczać można, że na gruncie praktycznym znaleźć można by sytuacje do
tego przypadku pasujące. Przykładem może tu być sytuacja, gdy na dobrze zdefiniowany rynek
(z pełną i jasną charakterystyką obecnych na nim graczy) wchodzi nowy podmiot, nie posiadający wystarczającego doświadczenia, by właściwie ocenić charakter własnej funkcji wypłaty (np.
modelu ponoszonych kosztów).
Osobno zostanie omówiony przypadek gry 2-osobowej i n-osobowej.
2-osobowa I-gra
Przypadek, w którym dany gracz (załóżmy gracz 1) nie zna swojego typu, natomiast zna typ
drugiego gracza jest w istocie bardzo podobny, do omawianego w oryginale przez Harasnyi
przypadku, gdy dany gracza zna swój typ, nie zna zaś typu drugiego gracza. W przypadku, gdy
gracz 1 znał swój typ, wiedział, że reprezentujący go typ tk1 jest aktywnym typem wybranym
przez loterię L, a więc, że należy do pary aktywnych typów w grze (tk1 , tm
2 ). Na podstawie wartości
prawdopodobieństwa pkm , czyli prawdopodobieństwa, że loteria L wybierze jako aktywne typy
k
w grze właśnie parę (tk1 , tm
2 ) oraz wiedzę, że t1 jest typem aktywnym, gracz 1 określał (zgodnie
z zależnością (5.4)) prawdopodobieństwo (warunkowe) π1k (m), że drugim aktywnym typem w
grze jest typ tm
2 .
Zauważmy, że teraz, gdy gracz 1 nie zna swojego typu, czyli nie wie, który z typów tk1 jest
jego aktywnym typem w grze, natomiast zna typ gracza 2, czyli wie, który z typów tm
2 jest
jego (czyli gracza 2) aktywnym typem w grze, to w oparciu o tę wiedzę, jak również znajomość
prawdopodobieństwa pkm , czyli prawdopodobieństwa, że loteria L wybierze jako aktywne typy
m
w grze właśnie parę (tk1 , tm
2 ), może wyznaczyć warunkowe prawdopodobieństwo π2 (k), czyli
prawdopodobieństwo, że drugim aktywnym typem w grze jest jego k-ty typ tk1 . Wartość tego
prawdopodobieństwa wyznaczy się w oparciu o tę samą zależność, z której gracz 2 w oryginalnym
przykładzie przyjętym przez Harsanyi (czyli gdy gracz 2 znał swój typ, nie znał zaś typu gracz 1)
wyznaczał to prawdopodobieństwo. A zatem prawdopodobieństwo π2m (k), że aktywnym typem
gracz 1 jest typ tk1 , przy znajomości (czyli pod warunkiem) drugiego aktywnego typu w grze tm
2
wyniesie:
pkm
.
π2m (k) = P r(tk1 |tm
2 ) = PM
m=1 pkm
(5.17)
W oparciu o tę wiedzę, gracz 1 może wyznaczyć swoją nową (semi-warunkową) funkcję
J. C. HARSANYI
54
wypłaty zgodnie z zależnością:
m ∗ m
um
1 = U1 (s1 , s2 ) =
K
X
π2m (k) · V1k (sk1 , sm
2 ; k, m).
(5.18)
k=1
gdzie s∗1 oznacza tu wektor K strategii:
s∗1 = (s11 , s21 , . . . , sk1 , . . . , sK
1 ),
(5.19)
Funkcja ta jest funkcją wypłaty gracza 1 w grze, która jest już grą z pełną informacją (C-gra).
Analogicznie, jeśli takie same założenia dotyczą gracza 2, tzn. że gracz ten wie, że aktywnym
typem gracza 1 jest typ tk1 , natomiast nie wie, który z jego typów tm
2 jest drugim aktywnym
typem w grze, to swoją (semi-warunkową) funkcję wypłaty w C-grze wyznaczyć może zgodnie z
zależnością:
uk2
=
U2k (sk1 , s∗2 )
=
M
X
π1k (m) · V2m (sk1 , sm
2 ; k, m).
(5.20)
m=1
gdzie s∗2 oznacza tu wektor M strategii:
M
s∗2 = (s12 , s22 , . . . , sm
2 , . . . , s2 ).
(5.21)
Zauważmy, że w zależnościach (5.18) i (5.20) zmieniło się indeksowanie wartości wypłaty i
semi-warunkowej funkcji wypłaty, względem rozpatrywanych w przykładzie Harsanyi zależności
(5.5) i (5.7). Funkcja wypłaty gracz 1 nie jest już oznaczona jako U1k , ale jako U1m . Analogicznie
funkcja wypłaty gracza 2 nie jest już oznaczana jako U2m , ale jako U2k . Podobnie mamy oznaczone
k
wartości wypłat um
1 i u2 . Indeks górny bowiem w każdym z przypadków informował nas o tym,
który z typów jest brany jako dany (jako warunek) przy wyznaczaniu zarówno warunkowych
prawdopodobieństw, jak i semi-warunkowych funkcji wypłat. Innymi słowy funkcja U1m , zdefiniowana zależnością (5.18) jest funkcją wypłaty gracza 1 wówczas, gdy aktywnym typem gracza
k
2 jest typ tm
2 . Analogicznie funkcja U2 , zdefiniowana zależnością (5.20) jest funkcją wypłaty
gracza 2 jeśli aktywnym typem gracza 1 jest typ tk1 .
Przy założeniu jednoczesnej kolejności ruchów graczy rozwiązaniem tak zdefiniowanej gry
G∗
będzie jedna z dostępnych w tej grze równowag Nasha.
N-osobowa I-gra
W szczególnym przypadku dany gracz i nie zna swojego typu, natomiast zna typy wszystkich innych graczy. Możemy też rozważyć przypadek bardziej ogólny, w którym gracz i zna typy jedynie
części graczy, natomiast nie zna swojego typu, jak również typów pozostałych (z wykluczeniem
znanej części graczy).
55
Oznaczmy przez tki h typ gracza i, który należy do zbioru właściwego ah . Wobec tego
vikh = Vikh (s∗ (h), c(h))
(5.22)
oznaczać będzie wypłatę gracza i, gdy jest on typu tki h , a aktywnym zbiorem w grze jest zbiór
ah .
Rozważmy przypadek najprostszy, zakładając, że gracz i zna typ tylko jednego z graczy j –
tm
j . Posiadając tę informację, gracz i może teraz określić prawdopodobieństwo, że jako aktywny
zbiór ā loteria wybrała konkretny zbiór ah wyniosłoby:
rh
πjm (h) = P r(ā = ah |tm
j ∈ ā) = P
.
(5.23)
πjm (h) · Vikh (s∗ (h), c(h)).
(5.24)
h∈Bjm rh
W tej sytuacji, funkcja wypłaty gracza i wyrazi się zależnością:
∗
ui = Ui (s ) =
H
X
h=1
p
Gdyby gracz i znały typy dwóch graczy tm
j i tl wówczas prawdopodobieństwo, że zbiorem
aktywnym ā będzie konkretny zbiór ah wyniesie:
mp
p
πjl
(h) = P r(ā = ah |(tm
j , tl ∈ ā)) = P
rh
h∈(Bjm +Blp ) rh
.
(5.25)
Oznaczmy więc przez t̄ zbiór wszystkich aktywnych w danej grze typów tm
j (przy czym t̄ ∈ ā),
o których gracz i wie, że są aktywne oraz przez B̄ zbiór indeksów h zbiorów właściwych, które
zawierają w sobie aktywne typy tm
j należące do zbioru t̄. Prawdopodobieństwo, że loteria L za
aktywny zbiór ā wybrała w tej grze zbiór właściwy ah wyniesie wówczas:
rh
.
πt̄ (h) = P r(ā = ah |(t̄ ∈ ā)) = P
h∈B̄ rh
(5.26)
Funkcja wypłaty gracza i wyrazi się wówczas zależnością:
ui = Ui (s∗ ) =
H
X
πt̄ (h) · Vikh (s∗ (h), c(h))
(5.27)
h=1
Funkcja ta definiuje już grę z pełną informacją (C-grę).
Rozwiązaniem tej gry, z racji na założoną jednoczesność wykonywania ruchów przez graczy
jest jedna z równowag Nash’a
5.2.3
Dany gracz nie zna swojego typu i nie zna typu innych graczy
Być może realne sytuacje gry rynkowej najlepiej pasują do tego przypadku. Źródeł niepewności
i ryzyka jest na tyle dużo i są one na tyle trudne do zidentyfikowania i zrozumienia, że gracze
praktycznie zawsze posiadają niepewną wiedzę tak zarówno na tema własnej charakterystyki
(typu) jak i charakterystyki (typów) innych graczy.
Podobnie jak w poprzednim punkcie osobno omówimy przypadek gry 2-osobowej i n-osobowej.
J. C. HARSANYI
56
2-osobowa I-gra
W przypadku, gdy dany gracz, załóżmy gracz 1 nie zna ani swojego typu, ani typu drugiego
gracza wszystko, co może stwierdzić to to, że loteria L wybierze określoną parę typów (tk1 , tm
2 )
jako aktywne typy w grze z prawdopodobieństwem równym pkm . Co więcej gracz ten zna swoją
warunkową funkcję wypłaty v1k , zdefiniowaną zależnością:
v1k = V1k (sk1 , sm
2 ; k, m)
(5.28)
Jest to jego funkcja wypłaty w I-grze G, czyli w grze z niepełną informacją.
Przechodząc na model probabilistyczny, czyli C-grę G∗ , grę z pełną (choć nie doskonałą –
imperfect) informacją, gracz ten musi wyznaczać swoją wypłatę u1 jako wartość oczekiwaną
(zarówno po własnych typach jak i typach gracza 2) z wypłat warunkowych v1k , a więc zgodnie
z zależnością:
u1 =
U1 (s∗1 , s∗2 )
=
K X
M
X
pkm · V1k (sk1 , sm
2 ; k, m).
(5.29)
k=1 m=1
Analogicznie, jeśli gracz 2 nie zna ani swojego typu, ani typu gracza 1, to swoją funkcję
wypłaty w C-grze G∗ wyznaczyć może zgodnie z zależnością:
u2 = U2 (s∗1 , s∗2 ) =
K X
M
X
pkm · V2m (sk1 , sm
2 ; k, m).
(5.30)
k=1 m=1
G∗
N-osobowa I-gra
W przypadku gry N-osobowej gdy dany gracz i nie zna ani swojego typu, ani typów pozostałych
(N-1) graczy wszystko, co może stwierdzić to to, że loteria L wybierze określony zbiór właściwy
ah jako zbiór aktywny ā z prawdopodobieństwem rh . Co więcej gracz i zna swoją warunkową
funkcję wypłaty vik , zdefiniowaną zależnością:
vik = Vik (s∗ (h), c(h)),
(5.31)
Nie wie jednakże, który z typów tki aktualnie go reprezentuje.
Jest to jego funkcja wypłaty w I-grze G, czyli w grze z niepełną informacją.
Przechodząc na model probabilistyczny, czyli C-grę G∗ , grę z pełną (choć nie doskonałą –
imperfect) informacją, gracz ten musi wyznaczać swoją wypłatę u1 jako wartość oczekiwaną
(zarówno po własnych typach jak i typach pozostałych graczy) z wypłat warunkowych v1kh , a
więc zgodnie z zależnością:
57
5.3. DANY GRACZ WYKONUJE RUCH JAKO PIERWSZY
ui = Ui (s∗ ) =
H
X
rh · Vikh (s∗ (h), c(h))
(5.32)
h=1
Analogiczną postać będzie miała funkcja każdego z pozostałych graczy, który nie zna ani swojego
typu ani typów pozostałych graczy.
G∗
5.2.4
Przypadki niesymetrycznej informacji
Zarówno w oryginalnym przypadku rozpatrywanym przez Harsanyi, jak i w dwóch wyżej omawianych zakładano symetrię odnośnie znajomości, bądź nie znajmości określonych typów w grze:
albo zakładano, że każdy z graczy zna swój typ, ale nie zna typów innych graczy, albo, że każdy
zna typy innych graczy, ale nie zna swojego, albo, że żaden nie zna typu żadnego z graczy.
W realnych sytuacjach rynkowych oczywiście możemy mieć również do czynienia z sytuacjami
mniej symetrycznymi. I tak np. możliwa jest sytuacja, w której gracz 1 posiada pełną informację
na temat wszystkich aktywnych typów w grze, gracz 2 może znać tylko swój aktywny typ,
nie znać natomiast pozostałych aktywnych typów, gracz 3 może nie znać swojego typu, znać
natomiast typy innych graczy, zaś gracz 4 może nie znać żadnych aktywnych typów w grze. A
zatem funkcja wypłaty każdego z graczy przyjmie inną postać. Dla gracza 1 będzie to po prostu
funkcja V1 1 , dla gracza 2 semi-warunkowa funkcja U2 jak w oryginalnym przykładzie Harsanyi,
dla gracza 3 semi-warunkowa funkcja U3 podobna do przedstawionej w punkcie 5.2.2 niniejszego
rozdziału, natomiast dla gracza 4 funkcja U4 analogiczna do przedstawionej w punkcie 5.2.3.
Przy założeniu, że gracze wykonują ruchy jednocześnie rozwiązaniem gry będzie jedna z
dostępnych (albo jedyna) równowag Nasha.
5.3
Dany gracz wykonuje ruch jako pierwszy
Zarówno w oryginalnym przykładzie rozważanym przez Harsanyi jak i w przypadkach analizowanych w tym rozdziale zakładano, że gracze wykonują ruchy równocześnie. Przy takim założeniu właściwym rozwiązaniem gry jest jednak z równowag Nasha (uzasadnienie tego faktu znaleźć
można w Dodatku C). W wielu konkretnych przypadkach to założenie nie musi być spełnione.
Co więcej, dany gracz wcale nie musi wiedzieć jaka będzie kolejność wykonywania ruchów w
grze. Ten fakt, jak to już stwierdzono w rozdziale 3 stanowi również źródło niepewności: jest
przykładem ograniczenia informacyjnego. Co więcej, ograniczenie to nie zostało uwzględnione
1
Dla prostoty omijamy tu indeksy górne, odpowiadające oznaczeniom aktywnych typów.
J. C. HARSANYI
58
przez Harsanyi (potwierdzeniem tego jest jego stwierdzenie, że właściwym rozwiązaniem gry G∗
jest jedna z równowag Nasha).
Zanim jednak przejdziemy, do potraktowania kolejności ruchów jako zmiennej nieznanej w
modelu, przyjrzymy się najpierw w jaki sposób gracze powinni rozgrywać gry z niepełną informacją (w rozumieniu przyjętym przez Harsanyi) jeśli kolejność ruchów jest ustalona i dany gracz
i wykonuje ruch jako pierwszy2 .
Rozważania przeprowadzone w poprzednich punktach pokazały, że generalnie każdą grę z
niepełną informacją można przedstawić za pomocą probabilistycznego modelu gry z pełną (choć
niedoskonałą) informacją i że funkcja wypłaty każdego z graczy może zostać wyrażona w sposób
jednoznaczny. Postać tej funkcji zależna była od informacji jaką dany gracz posiadał na temat
własnego typu, jak i typów innych graczy.
Dla prostoty przyjmiemy, że w grze bierze udział tylko dwóch graczy i oraz j a także, że ich
funkcje wypłaty C-grze G∗ oznaczone będą jako Ui oraz Uj . W zależności od posiadanej informacji funkcje te mogą przybrać różną postać (jak w punktach omawianych wyżej). Generalnie
jest mają one formę wartości oczekiwanej z warunkowych funkcji wypłaty Vi oraz Vj (funkcji
wypłaty w I-grze G), których postać jest a priori znana, przy czym prawdopodobieństwa pi
oraz pj przyjmują formę zależną od posiadanej informacji na temat własnego typu, jak też typu
drugiego gracza. W uproszczony sposób zapisać to możemy w następującej postaci:
Ui =
X
pki Vik
(5.33)
pkj Vjk .
(5.34)
k
Uj =
X
k
W przypadku, gdy gracze wykonują ruchy sekwencyjnie najpierw jeden gracz wykonuje ruch
(załóżmy gracz i) a potem drugi. Przy czym obaj gracze dążą do maksymalizacji swoich funkcji
wypłat. A więc gracz i, wybierając swoją strategię si musi przewidywać w oparciu o wiedzę,
jaką posiada na temat funkcji wypłaty gracz j – Uj , jaka będzie jego odpowiedź.
Istotną jest tu rzecz, iż gracz i zna tylko probabilistyczny model funkcji wypłaty gracza j:
funkcja Uj jest w istocie agregatem (tu wartość oczekiwana) jego rzeczywistych funkcji wypłaty
Vjk , której postać gracz i jedynie przewiduje z prawdopodobieństwem pj . W istocie mamy więc
tu przykład klasycznej sytuacji podejmowania decyzji w warunkach ryzyka, a jak wiadomo
maksymalizacja wartości oczekiwanej nie jest jedynym możliwym podejściem do tego typu sytuacji [38, 66]. W szczególności nie uwzględnia ona stosunku graczy do ryzyka (maksymalizacja
wartości oczekiwanej zakłada postawę neutralności wobec ryzyka). Rozwiązanie tego typu sytuacji zależne jest więc od subiektywnych preferencji graczy. Generalnie więc funkcje Ui oraz Uj
2
Przypadek, w którym dany gracz wykonuje ruch jako drugi jest o tyle prostym, że w momencie podejmowania
przez niego decyzji znana jest już decyzja gracza poprzedzającego jego ruch.
59
5.4. NIEZNANA KOLEJNOŚĆ RUCHÓW GRACZY
przedstawić można w postaci:
Ui = f(pki , Vik )
(5.35)
Uj = f(pkj , Vjk )
(5.36)
gdzie funkcja f jest tu funkcją agregującą wypłaty vik oraz vjk w sposób zgodny z subiektywnym
stosunkiem graczy do ryzyka.
Szczególnym przypadkiem będzie tu sytuacja w ramach której poszczególne prawdopodobieństwa pki czy pkj przyjmować będą jednakową wartość. Będzie to więc sytuacja wyboru decyzji w
warunkach niepewności, czy inaczej mówiąc przykład gry przeciwko naturze. A więc i funkcja
agregująca przyjmować będzie postać określonego kryterium wyboru strategii w tego typu grze
[41, 48].
Generalnie, wykonujący ruch jako pierwszy gracz i wybierał będzie taką strategię ŝi , dla
której zachodzi:
ŝi = arg max Ui (sli , ŝj (sli ))
l
(5.37)
gdzie ŝj (sli ) jest najlepszą odpowiedzią gracza j na daną (l-tą) strategię sli gracza i:
ŝj (sli ) = arg max Uj (sli , snj )∀i.
n
5.4
(5.38)
Nieznana kolejność ruchów graczy
W przypadku nieznajomości kolejności ruchów, dany gracz ma możliwość wyboru pomiędzy
rozwiązaniem Nasha, właściwym dla sytuacji gry z jednoczesnym wykonywaniem ruchów, a
rozwiązaniem właściwym dla gry sekwencyjnej.
Jest to więc typowy problem dwukryterialny [66, 100]. Jeśli oznaczmy przez Z R rozwiązanie
Nasha danej gry – rozwiązanie właściwe dla gry z równoczesnym wykonywaniem ruchów, oraz
przez Z S rozwiązanie właściwe dla gry sekwencyjnej, w której gracz i wykonuje ruch jako pierwszy, to jego problem decyzyjny (problem wyboru optymalnej strategii gry s̄i zapisać można w
formie następującego zadania optymalizacji:
ŝi = arg max F(Z R , Z S ),
(5.39)
gdzie F jest odpowiednią funkcją skalaryzującą, zgodną z preferencjami gracza i.
Analogiczne podejście należałoby zastosować w przypadku niepewności odnośnie tego, czy
gra będzie jednorazowa czy powtarzalna3 .
3
Analiza właściwości gier rozgrywanych wielokrotnie pozostanie tematem przyszłych badań.
60
5.5
J. C. HARSANYI
Wartość informacji
Ograniczenia informacyjne, jakim gracze podlegają kształtuje wynik, jaki spodziewają się uzyskać.
Wynik ten zależny jest od postaci ich funkcji wypłaty, zależnej od posiadanej przez nich informacji, od ich stosunku do ryzyka kształtującego postać funkcji agregującej f, a także od modelu
preferencji odzwierciedlonego w funkcji skalaryzującej F. Pokonanie określonego ograniczenia informacyjnego kształtuje w nowy sposób oczekiwany wynik gry. Różnica pomiędzy tymi wynikami
stanowi właściwą miarę wartości pozyskanej informacji.
Część II
Dodatki i Zakończenie
61
Dodatek A
Preferowana kolejność ruchów a
równowaga Nasha i model gry
Stackelberga
Rozpatrywany jest przypadek gry rynkowej, w której udział bierze dwóch graczy: A i B. Strategie
ai gracza A odzwierciedlają świadczone przez niego usługi na rynku detalicznym (dla użytkowników końcowych) oraz związane z nimi ceny (ich konkretna wysokość). Strategie bj odzwierciedlają usługi i związane z nimi ceny na rynku detalicznym gracza B. Usługi i związane z nimi ceny
na rynku hurtowym (usługi świadczone w relacji międzyoperatorskiej) reprezentowane są przez
strategie hl . O ile na strategie na rynkach detalicznych gracze posiadają indywidualny wpływ
(ustalają je w sposób niezależny) o tyle strategie na rynku hurtowym ustalane są w ramach
negocjacji międzyoperatorskich, a więc wybór określonej strategii hl zależny jest od decyzji obu
graczy. Dla potrzeb analizy przyjęte zostanie, że strategie hl oznaczają decyzje hipotetycznego
gracza H.
Gracze A i B oceniają swoje decyzje z punktu widzenia pojedynczego kryterium – funkcji
wypłaty, jak np. zysk, udział w rynku, czy dystrybucja ruchu w sieci. Wypłata (wartość funkcji
wypłaty) jaką gracze otrzymują jest rezultatem podjęcia odpowiednich decyzji na rynkach detalicznch: ai oraz bj , jak też na rynku hurtowym: hl . W rezultacie ustalenia strategii ai , bj i hl gracz
A otrzymuje wypłatę VjlA (ai ), natomiast gracz B wypłatę VilB (bj ). Wynik gry określony jest parą
wypłat [VjlA (ai )], VilB (bj )]. Obaj gracze znają nawzajem swoje macierze wypłat, jak również cel,
do jakiego dążą. Ponadto przyjęte zostanie, że obaj gracze dążą wyłącznie do maksymalizacji
własnej funkcji wypłaty1 .
1
W praktyce wartości funkcji wypłaty uzyskuje się na podstawie analizy konkretnych modeli popytu na świad-
czone usługi, modelu kosztu oraz ogólnego modelu architektury sieci. Gracze (przedsiębiorstwa telekomunikacyjne)
63
64
DODATEK A. PREFEROWANA KOLEJNOŚĆ RUCHÓW A RÓWNOWAGA NASHA I MODEL GRY
STACKELBERGA
Ruchy poszczególnych graczy reprezentowane są przez procesy ustalania cen na odpowiednich
rynkach:
• A – proces ustalania cen na rynku detalicznym gracza A,
• B – proces ustalania cen na rynku detalicznym gracza B,
• H – proces negocjacji stawek rozliczeniowych pomiędzy graczami A i B (ruch hipotetycznego gracza H).
Zakłada się, że procesy A, B i C są rozłączne, a kolejność ruchów jest ustalona.
Sytuacja w której żaden z procesów nie dobiegł końca określa się mianem gry podwójnej [42].
Sytuacja w której jeden z graczy: A, B lub H ustalił już swoje ceny (wybrał określoną strategię
gry) określa się mianem gry pojedynczej. Gra przebiega więc dwu fazowo. W pierwszej fazie
rozgrywana jest gra podwójna, natomiast w drugiej gra pojedyncza. Określona gra pojedyncza
jest więc rezultatem rozegrania gry podwójnej w określony sposób.
Dla potrzeb analizy przyjęta zostanie konwencja uprządkowywania wypłat graczy w formie
macierzy wypłat. W tabeli A.1 przedstawiono przykładową macierz wypłat w grze podwójnej.
Każdy z graczy (A, B i H) ma tu do wyboru po trzy strategie. Jeśli w tej grze pierwszym ruchem
Tabela A.1: Przykładowa macierz wypłat w grze podwójnej.
h1
h2
b1
b2
b3
a1
[2, 3]
[3, 1]
[1, 4]
a2
[2, 2]
[5, 3]
a3
[3, 2]
[3, 4]
h3
b1
b2
b3
b1
b2
b3
a1
[1, 2]
[2, 3]
[3, 2]
a1
[2, 5]
[3, 4]
[4, 3]
[3, 5]
a2
[5, 2]
[4, 3]
[4, 4]
a2
[1, 1]
[2, 5]
[2, 5]
[4, 2]
a3
[2, 3]
[3, 2]
[2, 3]
a3
[3, 3]
[3, 2]
[2, 3]
będzie proces negocjacji cen na rynku hurtowym H, które zakończą się wyborem strategii h1
(ustaleniem określonego przez tę strategię zakresu usług i odpowiadających im cen), wówczas gra
pojedyncza, w której udział biorą gracze A i B opisana będzie macierzą wypłat jak w tabeli A.2.
Jeśli w rezultacie jej rozegrania gracz A, wykonujący ruch jako pierwszy, wybierze np. strategię
A (a ), V B (b )] = [3, 4].
a3 , natomiast gracz B odpowie strategią b2 wówczas ustali się wynik [V21
3
31 2
nie zawsze muszą dążyć do maksymalizacji wartości kryterium, które przyjmują za miarę oceny podjętych decyzji.
Gracze równie dobrze mogą dążyć do minimalizacji, czy stabilizacji tych wartości. W takich przypadkach należy te
kryteria przekształcić do postaci maksymalizowanej. Ogólniejszym natomiast będzie przypadek, w którym gracze
dążą zarówno do maksymalizacji własnej funkcji wypłaty (cel indywidualnie efektywny), jak też do minimalizacji
funkcji wypłaty drugiego gracza (cel antagonistyczny).
A.1. PREFEROWANA KOLEJNOŚĆ RUCHÓW W GRZE POJEDYNCZEJ
65
Tabela A.2: Macierz wypłat w grze pojedynczej.
A.1
b1
b2
b3
a1
[2, 3]
[3, 1]
[1, 4]
a2
[2, 2]
[5, 3]
[3, 5]
a3
[3, 2]
[3, 4]
[4, 2]
Preferowana kolejność ruchów w grze pojedynczej
Przyjęta jako ustalona kolejność ruchów w grze nie jest bynajmniej dla graczy bez znaczenia.
Wykazane to zostanie na przykładzie gry pojedynczej.
Rozpatrzmy grę z macierzą wypłat jak w tabeli A.3. W tej grze obaj gracze A i B, dążący
do maksymalizacji własnej funkcji wypłaty chcieliby móc wykonać ruch jako pierwszy. Jeśli
pierwszy wykona ruch gracz A wówczas wybierze strategię a2 , co w rezultacie odpowiedzi b2
gracza B ustali wynik [3, 2]. Gdyby jednak gracz B wykonywał ruch jako pierwszy, wówczas
wybrałby strategię b1 , co w rezultacie odpowiedzi a1 gracza A ustaliłoby wynik [2, 3]. A zatem
dla obu graczy korzystnie jest ruszyć się jako pierwszy.
Tabela A.3: Macierz wypłat w grze pojedynczej z preferencją pierwszego.
b1
b2
a1
[2, 3]
[1, 1]
a2
[1, 1]
[3, 2]
Sytuacja będzie już inna, gdy macierz wypłat w grze pojedynczej przedstawiała się będzie
jak w tabeli A.4. W tym przypadku obu graczom opłaca się ruszyć jako drugi. Jeśli pierwszy
ruszy się gracz A wówczas niezależnie od tego, czy wybierze strategię a1 czy a2 ustali się wynik
[2, 3]. Jeśli pierwszy ruszy się gracz B, wówczas niezależnie od tego czy wybierze strategię b1 czy
b2 ustali się wynik [3, 2]. Każdy z graczy otrzymuje więc większą wypłatę wówczas, gdy rusza
się jako drugi.
Zakładając, że żaden z graczy nie ma strategii niejednoznacznych, czyli takich, które prowadzą
do jednakowej wypłaty dla gracza, który ją posiada, jednakże do innych wypłat dla drugiego
gracza, wprowadzić można następujące definicje:
Definicja A.1.1 Korzystnym dla gracza A jest ruszyć się jako pierwszy, wtedy i tylko wtedy,
STACKELBERGA
66
Tabela A.4: Macierz wypłat w grze pojedynczej z preferencją drugiego.
b1
b2
a1
[2, 3]
[3, 2]
a2
[3, 2]
[2, 3]
gdy:
VjA00 (ai0 ) > VjA0 (ai00 )
Korzystnym dla gracza A jest ruszyć się jako drugi, wtedy i tylko wtedy, gdy:
VjA00 (ai0 ) < VjA0 (ai00 )
gdzie:
i0
–
indeks optymalnej strategii gracza A, gdy A rusza się jako pierwszy,
j 00
–
indeks strategii racjonalnej odpowiedzi gracza B,
j0
–
indeks optymalnej strategii gracza B, gdy B rusza się jako pierwszy,
i00
–
indeks strategii racjonalnej odpowiedzi gracza A,
Użyte w powyższej definicji pojęcie optymalnej strategii gracza A oznacza tu taką strategię
ai , która z uwzględnieniem najkorzystniejszej z punktu widzenia gracza B odpowiedzi (strategii
b̂(ai )) da graczowi A najlepszą możliwą wypłatę: ai = â = arg maxi VĵA (ai ). Natomiast pojęcie
racjonalnej odpowiedzi gracza wprowadzono w celu zachowania ogólności rozważań. O ile bowiem
pojęcie odpowiedzi optymalnej odnosiłoby się wyłącznie do oceny z punktu widzenia wartości
wypłaty, jaką otrzymuje dany gracz (ten, który odpowiada) o tyle pojęcie odpowiedzi racjonalnej
zawiera w sobie również możliwość formułowania celów nie tylko optymalnych, jak przyjęta
tu maksymalizacja własnej funkcji wypłaty) ale również celów antagonistycznych, mierzących
bezpośrednio w pogorszenie wartości wypłaty drugiego gracza lub ukształtowanie odpowiedniej
różnicy pomiędzy własną wypłatą, a wypłatą drugiego gracza [42].
Analogiczną definicję sformułować można dla gracza B.
Sytuacja jaką mieliśmy w przypadku gier z macierzą wypłat jak w tabelach A.3 i A.4, kiedy
to dla obu graczy korzystnie było ruszyć się jako pierwszy lub jako drugi nie jest przypadkowa.
W istocie – poza przypadkami niejednoznaczności strategii, co omówione zostało w dalszej części
tekstu – preferencje obu graczy odnośnie optymalnej kolejności ruchów są zawsze przeciwstawne:
jeśli korzystnie jest dla gracza A ruszyć się jako pierwszy, to również korzystnie dla gracza B
jest ruszyć się jako pierwszy; jeśli korzystnie jest dla gracza A ruszyć się jako drugi, to również
korzystnie dla gracza B jest ruszyć się jako drugi. Prawdziwe są bowiem poniższe twierdzenia:
67
Twierdzenie A.1.1 Korzystnym dla gracza A jest ruszyć się jako pierwszy wtedy i tylko wtedy,
gdy korzystnym by ruszyć się jako pierwszy jest również dla gracza B.
B
VjA00 (ai0 ) > VjA0 (ai00 ) ⇐⇒ ViB
00 (bj 0 ) > Vi0 (bj 00 )
gdzie:
i0
–
indeks optymalnej strategii gracza A, gdy A rusza się jako pierwszy,
j 00
–
indeks strategii racjonalnej odpowiedzi gracza B,
j0
–
indeks optymalnej strategii gracza B, gdy B rusza się jako pierwszy,
i00
–
indeks strategii racjonalnej odpowiedzi gracza A,
Dowód.
Założenie, iż korzystnym dla gracza A jest ruszyć się jako pierwszy (wybrać strategię
ai0 ) równoznaczne jest ze stwierdzeniem, iż wartość wypłaty (VjA00 (ai0 )), jaką w wyniku racjonalnej
odpowiedzi (bj 00 ) gracza B (maksymalizujacej wypłatę ViB
0 (bj )) gracz A otrzyma jest lepsza od
tej (VjA0 (ai00 )), jaką otrzymałby, gdyby gracz B, znający racjonalne odpowiedzi gracza A (ai00 )
ruszał się jako pierwszy (bj 0 ). Innymi słowy zachodzi zależność:
VjA00 (ai0 ) > VjA0 (ai00 )
Fakt, że gracz B, w sytuacji ruszania się jako pierwszy wybrałby strategię inną niż bj 00 (bj 0 6= bj 00 )
oznacza w istocie – poza przypadkami niejednoznaczności, że wartość wypłaty w przypadku
ruszania się jako pierwszy (ViB
00 (bj 0 )) jest dla niego lepsza, niż w przypadku ruszania się, jako
drugi. Stąd:
B
ViB
00 (bj 0 ) > Vi0 (bj 00 )
Dowód drugiej strony implikacji jest analogiczny. Założenie, iż korzystnym dla gracza B jest
ruszyć się jako pierwszy (wybrać strategię bj 0 ) równoznaczne jest ze stwierdzeniem, iż wartość
wypłaty (ViB
00 (bj 0 )), jaką w wyniku racjonalnej odpowiedzi (ai00 ) gracza A (maksymalizujacej
wypłatę VjA0 (ai )) gracz B otrzyma jest lepsza od tej (ViB
0 (bj 00 )), jaką otrzymałby, gdyby gracz
A, znający racjonalne odpowiedzi gracza B (bj 00 ), ruszał się jako pierwszy (ai0 ). Innymi słowy
zachodzi zależność:
B
ViB
00 (bj 0 ) > Vi0 (bj 00 )
Fakt, że gracz A w sytuacji ruszania się jako pierwszy wybrałby strategię inną niż ai00 (ai0 6= ai00 )
oznacza w istocie, że wartość wypłaty w przypadku ruszania się jako pierwszy (VjA00 (ai0 )) jest
dla niego – poza przypadkami niejednoznaczności – lepsza, niż w przypadku ruszania się, jako
drugi. Stąd:
VjA00 (ai0 ) > VjA0 (ai00 )
STACKELBERGA
68
Twierdzenie A.1.2 Poza przypadkami niejednoznaczności – korzystnym dla gracza A jest ruszyć
się jako drugi wtedy i tylko wtedy, gdy korzystnym by ruszyć się jako drugi jest również dla gracza
B.
B
VjA00 (ai0 ) < VjA0 (ai00 ) ⇐⇒ ViB
00 (bj 0 ) < Vi0 (bj 00 )
Dowód.
Dowód analogiczny jak w przypadku twierdzenia A.1.1.
A zatem przy założeniu, że obaj gracze znają swoje macierze wypłat2 oraz cel, do jakiego
zmierzają, wprowadzić można następujące definicje:
Definicja A.1.2 Gra z preferencją pierwszego to gra, w której w sytuacji, gdy obaj gracze znają
nawzajem swoje macierze wypłat i cel do jakiego dążą, korzystnie dla obu jest ruszyć się jako
pierwszy.
Definicja A.1.3 Gra z preferencją drugiego to gra, w której w sytuacji, gdy obaj gracze znają
nawzajem swoje macierze wypłat i cel do jakiego dążą, korzystnie dla obu jest ruszyć się jako
drugi.
W powyższych definicjach systematycznie czynione było założenie braku niejednoznaczności
strategii graczy. W istocie zachodzić może przypadek, gdy dla jednego z graczy nie ma znaczenia,
którą z rozważanych strategii wybierze, każda bowiem dawała mu będzie jednakowo dobrą
wartość wypłaty. Będzie tak dla przykładu w grze z macierzą wypłat jak w tabeli A.5. W
Tabela A.5: Macierz wypłat w grze pojedynczej z jednostronną preferencją drugiego.
b1
b2
a1
[2, 2]
[3, 2]
a2
[3, 2]
[2, 2]
przypadku tej gry strategie b1 i b2 są dla gracza B niejednoznaczne. Niezależnie od tego, jaką
strategię wybierze gracz A gracz B i tak otrzyma wypłatę równą 2. Kolejność ruchów nie ma
więc dla niego znaczenia. Ma natomiast znaczenie dla gracza A. Ruszając się jako pierwszy,
niezależnie od tego, którą ze strategii ai gracz A wybierze, jego wypłata może przyjąć wartość
2
W przypadku gdy jeden z graczy nie zna macierzy wypłat drugiego gracza twierdzenia A.1.1 i A.1.2 nie
muszą być prawdziwe [42].
69
tak zarówno 2, jak i 3. W interesie więc gracza A jest więc ruszyć się jako drugi. Jeśli gracz B
wybrałby strategię b1 gracz B odpowiedziałby strategią a2 , jeśli natomiast gracz B wybrałby
strategię b2 gracz A odpowiedziałby strategią a1 . W obu przypadkach gracz A otrzyma wypłatę
równą 3.
Wprowadzić można zatem następującą definicję.
Definicja A.1.4 Gra z jednostronną preferencją drugiego to gra, w której w sytuacji, gdy obaj
gracze znają nawzajem swoje macierze wypłat i cel do jakiego dążą, dla jednego z graczy korzystnie jest ruszyć się jako drugi, dla drugiego zaś kolejność ruchów nie ma znaczenia.
Warto zauważyć, iż nie ma sensu wprowadzanie pojęcia gry z jednostronną preferencją pierwszego. Gra taka musiałaby być zdefiniowana jako gra, w której w sytuacji, gdy obaj gracze znają
nawzajem swoje macierze wypłat i cel do jakiego dążą, dla jednego z graczy korzystnie jest ruszyć
się jako pierwszy, dla drugiego zaś kolejność ruchów nie ma znaczenia. O korzyści z ruchu jako
pierwszy jest sens mówić wówczas, gdy z punktu widzenia danego gracza warto uprzedzić ruch
drugiego gracza, by w ten sposób „wymusić” na nim korzystną dla siebie odpowiedź. Założenie,
że dla drugiego gracza kolejność ruchów nie ma znaczenia równoznaczne jest ze stwierdzeniem,
że nic wymusić się nie da, a więc wyprzedzenie jego decyzji nie ma specjalnego sensu. Dlatego też
w twierdzeniu A.1.1 nie pojawia się zwrot warunkowy „poza przypadkami niejednoznaczności”,
który zawarto w twierdzeniu A.1.2.
Warto również zauważyć, iż identyczność wartości wypłat danego gracza dla dwóch różnych
strategii nie gwarantuje ich niejednoznaczności. Kwestia ta jest zależna od tego, jakie wartości dla
tych strategii przyjmują wypłaty drugiego gracza oraz od kolejności ruchów graczy.Dla przykładu
w grze z macierzą wypłat jak w tabeli A.6 strategie b1 i b2 gracza B posiadają identyczne wartości
wypłat gracza B dla wszystkich strategii gracza A. Nie są one jednak niejednoznaczne wówczas,
gdy gracz B musiałby się ruszyć jako pierwszy. Jeśli w takiej sytuacji gracz B wybrałby strategię
b1 , wówczas odpowiedzią gracza A byłaby strategia a2 , co dało by wynik [3, 3]. Jeśli gracz B
wybrałby strategię b2 , wówczas odpowiedzią gracza A byłaby strategia a1 , co dałoby wynik [3, 2].
Dla gracza B nie jest więc bez znaczenia, którą ze strategii bj wybierze. Zależność ta nie będzie
jednak już zachodzić wówczas, gdy gracz B ruszał się będzie jako drugi. Wówczas obie strategie
będą dla gracza B tak samo atrakcyjne, a więc niejednoznaczne.
Dla odmiany możliwy jest również przypadek, kiedy to strategie o różnych wartościach
wypłat dla gracza B będą dla niego niejednoznaczne. Zachodzić tak może jedynie wówczas,
gdy gracz B będzie wykonywał ruch jako pierwszy. Dla przykładu w grze z macierzą wypłat jak
w tabeli A.7 w sytuacji gdy gracz B musi wykonać ruch jako pierwszy nie ma dla niego znaczenia,
którą ze strategii bj wybierze, w obu bowiem przypadkach może się spodziewać wypłaty równiej
70
STACKELBERGA
Tabela A.6: Macierz wypłat w grze, w której mimo identyczności wypłat gracza B
dla strategii b1 i b2 nie są one niejednoznaczne.
b1
b2
a1
[2, 2]
[3, 2]
a2
[3, 3]
[2, 3]
ViB (bj ) = 3: na strategię b1 gracz A odpowie strategią a2 , natomiast na strategię b2 odpowie
strategią a1 , co doprowadzi odpowienio do wyników [3, 3] albo [2, 3].
Tabela A.7: Macierz wypłat w grze, w której mimo różnych wartości wypłat dla
strategii gracza B, strategie te są niejednoznaczne wówczas, gdy gracz B wykonuje
ruch jako pierwszy.
b1
b2
a1
[1, 2]
[2, 3]
a2
[3, 3]
[2, 1]
W przypadku gdy gracz B wykonuje ruch jako drugi z niejednoznacznością strategii będziemy
mieli do czynienia jedynie wówczas, gdy dla planowanej do wybrania przez gracza A strategii
ai , wartości wypłat gracza B dla niejednoznacznych strategii są identyczne. Gdyby tak nie
było, gracz B wybrałby strategię dającą mu większą wartość wypłaty, co przeczy założonej
niejednoznaczności.
Wprowadzić można ponadto definicję gry bez preferencji ruchów.
Definicja A.1.5 Gra bez preferencji ruchów to gra, w której kolejność ruchów dla żadnego z
graczy nie ma znaczenia.
Dla przykładu gra z macierzą wypłat jak w tabeli A.8 jest grą bez preferencji ruchów.
Niezależnie od tego, kto wykonywał będzie ruch jako pierwszy spodziewanym rezultatem gry
będzie wynik [3, 3].
A.2. PREFEROWANA KOLEJNOŚĆ RUCHÓW A RÓWNOWAGA NASHA
71
Tabela A.8: Macierz wypłat w grze bez preferencji ruchów.
A.2
b1
b2
a1
[1, 2]
[2, 1]
a2
[3, 3]
[2, 1]
Preferowana kolejność ruchów a równowaga Nasha
Równowaga Nasha zdefiniowana jest [83] jako taki wynik gry, w którym żadnemu z graczy –
przy założeniu że drugi gracz utrzyma swoją aktualna strategię – nie opłaca się zmieniać swojej
strategii gry. W sposób formalny, dla gry w postaci normalnej [98] rozwiązanie równowagowe
określa się jako taką łączną decyzję x∗ ∈ X0 (X0 - zbiór decyzji dopuszczalnych), że:
fi (x∗1 , . . . x∗i , . . . x∗n ) fi (x∗1 , . . . xi , . . . x∗n ), ∀x ∈ X0 , ∀i = 1, . . . n
Przy założeniu różniczkowalności funkcji wypłaty fi (x) wynika stąd układ poniższych warunków
koniecznych:
∂fi (x∗ )
= 0, ∀i = 1, . . . n
∂xi
Zgodnie z przyjętą w pracy konwencją oznaczeń otrzymujemy:
x1 = ai ,
x2 = bj ,
f1 (x1 , x2 ) = VjA (ai ),
f2 (x1 , x2 ) = ViB (bj ).
Charakterystyczną cechą gry z macierzą wypłat jak w tabeli A.3 jest fakt, iż posiada ona
dwie równowagi Nasha: korzystniejszą dla gracza A równowagę [3, 2] oraz korzystniejszą dla
gracza B równowagę [2, 3]. Jest to gra z preferencją pierwszego, w której każdy z graczy dąży
do uzyskania innego rozwiązania równowagowego. Nie jest to jednakże ogólna zasada dla gier, w
których gracze chcą wykonać ruch jako pierwszy. Dla przykładu w grze z macierzą wypłat jak w
tabeli A.9 jest tylko jedno rozwiązanie równowagowe [2, 3], jednakże w interesie obu graczy jest
wykonanie ruchu jako pierwszy. Gracz A chciałby jako pierwszy wybrać strategię a1 , co w wyniku
odpowiedzi b1 gracza B dałoby wynik [3, 2], nie bądący rozwiązaniem równowagowym: przy
założeniu ustalonej strategii b1 gracz A nie wybrałby strategii a1 tylko a2 , co dałoby graczowi A
STACKELBERGA
72
korzystniejszy niż [3, 2] wynik [4, 1]. Jednakże na strategię a2 gracz B odpowiedziałby strategią
b2 .
Gracz B natomiast chciałby jako pierwszy wybrać strategię b2 , co w wyniku odpowiedzi a2
gracza A dałoby wynik [2, 3], będący rozwiązaniem równowagowym:
Tabela A.9: Macierz wypłat w grze z preferencją pierwszego, w której jest tylko jedno
rozwiązanie równowagowe.
b1
b2
a1
[3, 2]
[1, 1]
a2
[4, 1]
[2, 3]
Możliwa jest jednak również sytuacja, w której gra z preferencją pierwszego nie ma wcale
rozwiązania równowagowego3 , jak to dla przykładu mamy w grze z macierzą wypłat jak w
tabeli A.10. W tej grze obaj gracze chcą ruszyć się jako pierwszy: gracz A wybierając strategię
a1 , co na skutek odpowiedzi b1 dałoby wynik [4, 2], gracz B wybierając strategię b2 , co na skutek
odpowiedzi a2 dałoby wynik [2, 3]. Żadne z tych rozwiązań nie jest rozwiązaniem równowagowym.
Dla ustalonej strategii ai = a1 gracz B wybierze strategię b1 , co da wynik [4, 2]. Jednak, jeśli
gracz A miałby pewność, że gracz B odpowie strategią b1 , wybrałby strategię a2 , co dałoby
korzystniejszy dla A wynik [5, 1]. Analogicznie, dla ustalonej strategii bj = b2 gracz A wybierze
strategię a3 , co da wynik [2, 3]. Jednak, jeśli gracz B miałby pewność, że gracz A odpowie
strategią a3 , wybrałby strategię b1 , co dałoby korzystniejszy dla B wynik [2, 4].
Tabela A.10: Macierz wypłat w grze z preferencją pierwszego, w której nie ma
rozwiązania równowagowego.
b1
b2
a1
[4, 2]
[1, 1]
a2
[5, 1]
[1, 1]
a3
[2, 4]
[2, 3]
Charakterystyczną cechą gry z macierzą wypłat jak w tabeli A.4, która jak to wykazano
3
Bierze się tu pod uwagę jedynie tzw. strategie czyste – gracz może wybrać tylko jedną strategię. Nie rozważa
się tu przypadku strategii mieszanych, w które polegają na możliwości wyboru kilku strategii z różnym prawdopodobieństwem [83].
A.2. PREFEROWANA KOLEJNOŚĆ RUCHÓW A RÓWNOWAGA NASHA
73
jest grą z preferencją drugiego, jest brak rozwiązania równowagowego. Nie jest to jednak właściwość ogólna. Istnieją bowiem również gry z preferencją drugiego, które posiadają rozwiązania
równowagowe. Będzie tak dla przykładu w grze z macierzą wypłat jak w tabeli A.11. W tej grze
wynik [2, 2] jest rozwiązaniem równowagowym: dla ustalonej strategii ai = a3 gracz B wybierze
strategię b3 ; dla ustalonej strategii bj = b3 gracz A wybierze strategię a3 . Nie jest to jednakże
rozwiązanie efektywne. W istocie obaj gracze liczą na to, że będą mogli wykonać ruch jako
drugi, a drugi gracz nie wybierze strategii prowadzącej do wyniku [2, 2]. Jeśli pierwszy ruszy się
gracz A i wybierze strategię a1 lub a2 , gracz B może doprowadzić do wyniku [3, 4], wybierając
strategię b1 w odpowiedzi na strategię a1 lub b2 w odpowiedzi na strategię a2 . Analogicznej
korzyści (wyniku [4, 3]) może się spodziewać gracz A, jeśli pierwszy wykona ruch gracz B. W
interesie obu graczy jest więc wykonać ruch jako drugi, a żaden z nich nie jest zainteresowany
rozwiązaniem równowagowym.
Tabela A.11: Macierz wypłat w grze pojedynczej z preferencją drugiego, w której
istnieje rozwiązanie równowagowe.
b1
b2
b3
a1
[3, 4]
[4, 3]
[1, 1]
a2
[4, 3]
[3, 4]
[1, 1]
a2
[1, 1]
[1, 1]
[2, 2]
W kontekście gry z rozwiązaniem równowagowym, którego wybór leży w interesie jednego z
graczy sformułować można następujące twierdzenie:
Twierdzenie A.2.1 Jeśli w danej grze w interesie jednego z graczy będzie wybór rozwiązania
równowagowego, to jest to albo gra z preferencją pierwszego, albo gra bez preferencji ruchów.
Z sytuacją gry z preferencją pierwszego będziemy mieli do czynienia wówczas, gdy drugi gracz
dążył będzie do osiągniecia innego wyniku (równowagowego, jak to było w grze z macierzą
wypłat jak w tabeli A.3, lub nie równowagowego, jak to było w grze z macierzą wypłat jak w
tabeli A.10). Z sytuacją gry bez preferencji ruchów, będziemy mieli do czynienia wówczas, gdy
w interesie obu graczy jest osiągniecie tego samego wyniku. W szczególności nie możliwa jest
sytuacja, w której taka gra będzie grą z preferencją drugiego, czy z jednostronną preferencją
drugiego.
STACKELBERGA
74
Dowód.
strategie
Z definicji rozwiązania równowagowego wynika, że jeśli do rozwiązania tego prowadzą
a∗i
i b∗j , to graczom nie opłaca się zmieniać swojej strategii, jeśli mają pewność, że drugi
gracz swojej nie zmieni. Z założenia, że w interesie danego gracza – np. A – jest osiągnięcie
rozwiązania równowagowego, do którego prowadzi wybór strategii a∗i i b∗j wynika, (po pierwsze)
że gracz ten (ruszając się jako drugi) nie wybierze innej strategii ai 6= a∗i jako odpowiedzi na
strategię b∗j , jak również (po drugie), że nie jest w jego interesie, by gracz B wybrał strategię
inną niż b∗j . Gracz A nie może więc odnieść korzyści z tego, że wykonywał będzie ruch jako drugi.
Nie może też takiej korzyści odnieść gracz B, bowiem stałoby to w sprzeczności z definicją
rozwiązania równowagowego. Z definicji tej wynika bowiem, że w odpowiedzi na strategię a∗i
gracz B nie odniesie korzyści wybierając strategię inną niż b∗j , co byłoby konieczne, aby rozpatrywana gra była grą z jednostronną preferencją drugiego. Rozwiązanie jest rozwiązaniem
równowagowym właśnie dlatego, że każdemu z graczy (a więc również graczowi B) opłaca się
wybrać strategię prowadzącą do niego (b∗j ), jeśli drugi gracz wybrał strategię (a∗i ), która osiągnięcie tego rozwiązania umożliwia.
A.3
Preferowana kolejność ruchów a model gry Stackelberga
W literaturze teorii gier [2, 5, 15, 20, 57, 54, 91, 94] od dawna funkcjonuje pojęcie gry Stackelberga, od nazwiska niemieckiego ekonomisty Heinricha Freiherra von Stackelberga, który jako
jeden z pierwszych badał gry, w których gracze wykonują ruchy sekwencyjnie4 .
W klasycznym modelu Stackelberga gracz, który wykonuje ruch jako pierwszy określany jest
jako leader, natomiast gracz wykonujący ruch jako drugi jako follower. Model opisuje zjawisko
konkurencji duopolistycznej, w której leader zna potencjalną odpowiedź follower’a, a przy tym
obaj gracze podejmują decyzje o charakterze ilościowym5 dotyczącą planowanej wielkości produkcji, przy określonym poziomie popytu. W modelu gry Stackelberga leader jest zawsze w
uprzywilejowanej pozycji (first mover adventage), mając możliwość ustalenia takiej wielkości
produkcji, która umożliwi mu uzyskanie większego udziału w rynku względem follower’a, którego
(racjonalna) odpowiedź jest niejako wymuszona, przez pierwotną decyzję leader’a.
Formalnie zapisać to można w następujący sposób. Niech xL i xF oznaczają planowane
wielkości produkcji odpowiednio gracza A (leader’a) i gracza B (follower’a). fL (xL , xF ) oraz
fF (xL , xF ) oznaczają udziały w rynku, jakie gracze uzyskują w efekcie ustalenia wielkości produkcji na poziomach xL i xF . Gracz A, leader wie, że w rezultacie ustalenia przez niego wielkości
produkcji na poziomie xL gracz B ustali w odpowiedzi taką wielkość produkcji xF = rF (xL ),
4
5
Swój model gry sekwencyjnej Stackelberg opublikował 1934 roku w pracy Marktform und Gleichgewicht.
Konkurencję o charakterze cenowym opisuje tzw. model Bertranda.
75
A.3. PREFEROWANA KOLEJNOŚĆ RUCHÓW A MODEL GRY STACKELBERGA
dla której funkcja udziału w rynku follower’a – fF (xL , xF ) przyjmie wartość maksymalną.
max fF (xL , xF ) = fF (xL , rF (xL ))
xF
(A.1)
rF (xL ) oznacza tu tzw. funkcję reakcji follower’a na określoną decyzję xL leader’a. Wiedząc,
jaki charakter będzie miała odpowiedź follower’a (znając jego funkcję reakcji rF (.)) leader ustala
taką wartość produkcji xL , która z uzwględnieniem odpowiedzi follower’a zmaksymalizuje jego
udział w rynku.
x∗L = arg max fF (xL , rF (xL ))
xL
(A.2)
Przewaga leader’a bywa interpretowana, jako przewaga o charakterze informacyjnym: leader
wie, jaki charakter będzie miała odpowiedź followera i ma możliwość przekazania informacji o
podjętej przez siebie decyzji, lub też możliwość złożenia nieodwołalnego zobowiązania do wykonania określonego ruchu6 . Przy takiej interpretacji leader de facto nie musi wykonywać ruchu
jako pierwszy, a jedynie złożyć nieodwołalną i wiarygodną deklarację wybrania określonej strategii. Wówczas ruch follower’a, będący w istocie pierwszym ruchem w grze musi być uzależniony od
deklarowanego ruchu leader’a. Na gruncie tej interpretacji zrodziła się rodzina gier określanych
mianem odwrotnych gier Stackelberga (Inverse Stackelberg Games) [68, 69, 91]. W odwrotnej
grze Stackelberga to follower wykonuje ruch jako pierwszy, natomiast leader ma możliwość
przekazania mu informacji na temat tego, jaka będzie jego odpowiedź na określony ruch follower’a – rL (xF ). W oparciu o tę informację follower wybiera taką wielkość produkcji xF , która
maksymalizuje jego udział w rynku:
x∗F = arg max fF (rL (xF ), xF )
xF
(A.3)
∗ (x ).
Problem decyzyjny leader’a sprowadza się tu do wyboru optymalnej funkcji reakcji rL
F
Symbolicznie ująć to można w formie poniższego zadania optymalizacji:
∗
rL
(.) = arg max fL (rL (x∗F ), x∗F )
rL (.)
(A.4)
Abstrachując od charakteru podejmowanych decyzji (ilościowych czy cenowych) stwierdzić
należy, iż analizowane tu gry z preferencją pierwszego (np. przykład A.3) stanowią adekwatną
ilustrację modelu gry Stackelberga, kiedy to wykonujący ruch jako pierwszy leader odnosi z tego
faktu korzyść. Jednakże z racji na asymetrię informacyjną nie można w ogólności powiedzieć,
6
Osobnym problemem staje się tu wiarygodność przekazanych przez leader’a informacji z punktu widzenia
follower’a, czy też w ogóle możliwość odbioru takich informacji. W przypadku, gdy follower nie odbiera lub nie
uwzględnia informacji o wykonanym przez leader’a ruchu (czy też nieodwołalnym zobowiązaniu do jego wykonania), jego odpowiedź może być dla leader’a zaskoczeniem, a do opisu sytuacji bardziej trafnym staje się wówczas
model Cournot’a, w którym gracze wykonuję ruchy jednocześnie [61] .
STACKELBERGA
76
że follower skorzystałby w tej grze na wykonywaniu ruchu jako pierwszy. Leader jest tu w
o tyle lepszej sytuacji, że zna funkcję reakcji rF (xl ) follower’a, co w istocie oznacza znajomość
jego macierzy wypłat i celu do jakiego zmierza (indywidualnie efektywny, lub antagonistyczny)7 .
Natomiast nie znając funkcji reakcji leader’a rL (xF ) follower w istocie rozgrywałby grę przeciwko
naturze, a to oznacza, że bardziej opłacałoby mu się wykonywać ruch jako drugi, kiedy to będzie
już znał decyzję xL leader’a [46, 51].
Natomiast model odwrotnej gry Stackelberga stanowi adekwatną ilustrację gry z preferencją
drugiego (np. przykład A.4) i to dla obu graczy. Jeśli w grze tej opłaca się leader’owi wykonać
ruch jako drugi i przekazać follower’owi jedynie charakter swojej odpowiedzi (funkcję reakcji
rL (xF ) nie zaś rzeczywistą funkcję wypłaty fL (xL , xF )), umożliwiającą mu w ten sposób wpływanie na ruch follower’a, to na mocy twierdzenia A.1.2 oznacza to, że korzystniej również dla
follower’a będzie wykonać ruch jako drugi.
Warto jednakże zauważyć, iż model odwrotnej gry Stackelberga nie utożsamia się w sposób
prosty z grą z preferencją drugiego. W istocie konieczność wykonania ruchu jako drugi może
być dana niezależnie, czy jest to sytuacja korzystna dla danego gracza, czy nie [53]. I tak, dla
przykładu leader może być zmuszony wykonywać ruch jako drugi w grze, w której wolałby móc
wykonywać ruch jako pierwszy (zmuszony do wykonania ruchu jako drugi w grze z preferencją
pierwszego). I tu już do analizy jego sytuacji decyzyjnej właściwym będzie model odwrotnej gry
Stackelberga.
W istocie rzeczy pierwszym pytaniem, na które posiadający przewagę informacyjną leader
musi odpowiedzieć, jest to w jaką grę bardziej opłaca mu się grać: w grę Stackelberga, czy w
odwrotną grę Stackelberga, czyli czy wykonać ruch jako pierwszy, czy jako drugi. Odpowiedź
na to pytanie uzależniona jest z jednej strony od struktury macierzy wypłat graczy i tego, czy
definiują one grę z preferencją pierwszego, czy grę z preferencją drugiego, z drugiej zaś strony
od tego, czy follower posiadający jedynie informację na temat własnej funkcji wypłaty fF (.)
oraz albo informację na temat decyzji leader’a – xL (model gry Stackelberga) albo jego funkcji
reakcji rL (xF ), uzna tę informację (w szczególnym przypadku deklarację leader’a) za wiarygodną. Możliwe bowiem są przypadki, kiedy to w grze z preferencją pierwszego, przy założeniu
przewagi informacyjnej leader’a korzytniej będzie dla niego wykonać ruch jako drugi. Będzie
tak wówczas, kiedy follower, pozbawiony informacji na temat macierzy wypłat leader’a – czyli
rozgrywający w istocie grę przeciwko naturze – wybierze strategię (dobrze uzasadnioną z punktu
7
Zakład się tu, że funkcja reakcji folower’a jest rezultatem znajomości przez leader’a jego macierzy wypłat
i celu, do jakiego zmierza. Pomija się natomiast przypadek, kiedy to follower (na wzór leader’a w odwrotnej
grze Stackelberga) przekazuje leader’owi informację na temat swojej funkcji reakcji, nie odsłaniając rzeczywistej
macierzy wypłat, ani motywu (celu do jakiego zmierza), który stoi u korzania transformacji tej macierzy w funkcję
reakcji.
A.3. PREFEROWANA KOLEJNOŚĆ RUCHÓW A MODEL GRY STACKELBERGA
77
widzenia gry przeciwko naturze), która będzie dla leader’a korzystniejsza, niż gdyby ten miał
wykonać ruch jako pierwszy, a strategia follower’a byłaby na ten ruch odpowiedzią.
Przykład A.1
Macierz wypłat dla graczy A i B przedstawia się jak w tabeli A.128 . Jest to gra z preferencją
pierwszego. W sytuacji, gdy obaj gracze znają swoje macierze wypłat obaj chcieliby wykonać
ruch jako pierwszy (przy założeniu, że gracze dążą do celu indywidualnie efektywnego). Gracz
A wybrałby wówczas strategię a2 , co w rezultacie odpowiedzi b2 ustaliłoby korzystniejszy dla
A wynik [3, 2], natomiast gdyby pierwszy wykonał ruch gracz B wybrałby strategię b3 , co w
rezultacie odpowiedzi a1 ustaliłoby korzystniejszy dla B wynik [2, 3].
Tabela A.12: Ilustracja przypadku, gdy graczowi A opłaca się ruszyć jako pierwszy,
gdy gracz B zna jego macierz wypłat i jako drugi, gdy gracz B nie zna jego macierzy
wypłat.
b1
b2
b3
a1
[4,1]
[1,1]
[2,3]
a2
[0,1]
[3,2]
[1,1]
a3
[0,3]
[1,0]
[1,0]
Jednakże w sytuacji, gdy gracz B nie znałby macierzy wypłat gracza A (gra w grę przeciwko
naturze) i byłby zmuszony do ruszania się jako pierwszy, decyzję odnośnie wyboru strategi
oparłby wyłącznie na analizie własnej macierzy wypłat, korzystając z różnych kryteriów wyboru
strategii w grach przeciwko naturze [48, 47, 66, 83, 102]. W zaprezentowanym przykładzie wektor
wypłat gracza B, odpowiadający strategii b1 z dokładnościa do uporządkowania składowych
dominuje wektory wypłat dla strategii b2 i b3 . W związku z tym wszystkie racjonalne kryteria
wyboru strategii wskażą, jako najlepszą w ich sensie strategię b1 . Należy się wiec spodziewać,
że gracz B, nie znając macierzy wypłat gracza A, a co się z tym wiąże potencjalnych jego
odpowiedzi, wybierze właśnie tą strategię. W tej sytuacji gracz A odpowiedziałby strategią a1 ,
uzyskując w ten sposób najkorzystniejszy dla siebie wynki [4, 1].
8
Przykład zaczerpnięty z innego ([51]) artykułu Autora.
STACKELBERGA
78
A.4
Wnioski
Z przeprowadzonych analiz wynikają następujące stwierdzenia:
• Jeśli w danej grze pojedynczej obaj gracze posiadają określone preferencje odnośnie kolejności wykonywania ruchów, to są to zawsze preferencje przeciwstawne: albo obaj chcieliby
wykonać ruch jako pierwszy, albo obaj jako drugi;
• Jeśli w danej grze pojedynczej tylko jeden z graczy posiada preferencje odnośnie kolejności wykonywania ruchów (dla drugiego kolejność ruchów nie ma znaczenia), to jest to
preferencja, by wykonywać ruch jako drugi;
• Niejednoznacznymi (jak i jednoznacznymi) strategiami mogą być tak zarówno strategie,
którym odpowiadają zarówno jednakowe jak i niejednakowe wektory wypłat danego gracza;
• Nie ma bezpośredniej zależności pomiędzy faktem istnienia, bądź nieistnienia równowagi
Nasha (w strategiach czystych), a preferencją ruchów w grze pojedynczej;
• Jeśli w danej grze w interesie jednego z graczy będzie wybór rozwiązania równowagowego,
to jest to albo gra z preferencją pierwszego, albo gra bez preferencji ruchów;
• Gry z preferencją pierwszego stanowią adekwatną ilustrację modelu gry Stackelberga, jednakże z racji na asymetrię informacyjną, zakładaną w tym modelu gry nie można w ogólności powiedzieć, że follower skorzystałby w tej grze na wykonaniu ruchu jako pierwszy;
• Gry z preferencją drugiego stanowią adektwatną ilustrację modelu odwrotnej gry Stackelberga, w której zarówno leader’owi jak i follower’owi opłacałoby się wykonać ruch jako
drugi;
• Kluczową kwestią dla posiadającego przewagę informacyjną leader’a jest odpowiedź na pytanie o najbardziej korzystną dla niego kolejność ruchów, czyli wybór gry (gry Stackelberga
lub odwrotnej gry Stackelberga), w którą będzie grał;
• Istnieją gry z preferencją pierwszego, w której z racji na ograniczenia informacyjne follower’a opłaca się leader’owi wykonać ruch jako drugi.
Dodatek B
Narzędzia wspomagania decyzji w
warunkach niepewności i ryzyka
B.1
Narzędzia wspomagania decyzji w warunkach niepewności
- kryteria wyboru strategii w grze przeciwko naturze
W niniejszym dodatku przedstawiono znane z literatury [14, 65, 66, 83, 102], jak również autorskie [41] kryteria wyboru strategii w grach przeciwko naturze. Kryteria te stanowią właściwe
narzędzia wspomagania decyzji w sytuacji niepewnośći
B.1.1
Kryterium Walda
Jest to procedura wyboru strategii, charakteryzująca się największą awersją do ryzyka. Zakłada,
iż zdarzy się sytuacja najbardziej niekorzystna (gracz B wybierze taką strategię, która dla danej
strategii gracza A da temuż wypłatę najgorszą z możliwych) i w takich warunkach określana jest
najlepsza strategia (gracza A). Jest to tak zwana strategia maxminowa. Dla każdej z własnych
strategii określana jest najgorsza (tu najmniejsza) z możliwych wypłat, a następnie wybierana
jest ta strategia, która tę wypłatę maksymalizuje.
Jeśli przyjmiemy następujące oznaczenie:
VjA (ai ) - wielkość wypłaty dla gracza A, gdy wybrał on strategię ai , a gracz B wybrał
strategię bj ,
wówczas kryterium Walda definiuje następujące zadanie optymalizacji:
max{min VjA (ai ) : i ∈ IA }.
j
79
(B.1)
80 DODATEK B. NARZĘDZIA WSPOMAGANIA DECYZJI W WARUNKACH NIEPEWNOŚCI I RYZYKA
Kryterium Walda sformułowane w postaci (B.1), którą nazwiemy postacią szczególną, może
prowadzić do niejednoznaczności rozwiązania, tzn., nie wyłoni jednej strategii najlepszej w sensie
tego kryterium, lecz ich zbiór, mimo że któraś z nich będzie wyraźnie lepsza.
Dlatego też użytecznym może być sformułowanie kryterium Walda w postaci ogólnej. Zasada
będzie tu następująca. Dla potrzeb sformułowania kryterium Walda w postaci ogólnej wprowadzimy przekształcenie porządkujące Θ(x), spełniające zależność
θ1 (x) ¬ θ2 (x) ¬ ... ¬ θJ (x),
(B.2)
gdzie J oznacza liczbę składowych wektora x. Przekształcenie to porządkuje elementy składowe
wektora x w kolejności od najmniejszego do największego.
Korzystając z przekształcenia θ, kryterium Walda w postaci ogólnej wyrazimy zależnością
lexmax{θ1 (VA (ai )), θ2 (VA (ai )), ...θm (VA (ai )) : i ∈ IA }.
(B.3)
Gdzie VA (ai ) jest wektorem wypłat dla strategii i gracza A.
B.1.2
Kryterium optymistyczne
Jest to procedura wyboru strategii, charakteryzująca się największym optymizmem. Zakłada,
iż zdarzy się sytuacja najbardziej korzystna (gracz B wybierze taką strategię, która dla danej
strategii gracza A da temuż wypłatę najlepszą z możliwych) i w takich warunkach określana
jest najlepsza strategia (gracza A). Dla każdej z własnych strategii określana jest najlepsza
(tu największa) z możliwych wypłat, a następnie wybierana jest ta strategia, która tę wypłatę
maksymalizuje.
Kryterium optymistyczne zdefiniowane jest przez następujące zadanie optymalizacji:
max{max VjA (ai ) : i ∈ IA }.
j
(B.4)
W sformułowaniu ogólnym kryterium optymistyczne zdefiniowane będzie poniższym zadaniem optymalizacji leksykograficznej
lexmax{θJ (V(ai )), θJ−1 (V(ai )), ...θ1 (V(ai )) : i ∈ IA }.
B.1.3
(B.5)
Kryterium Hurwicza
Kryterium Hurwicza jest uogólnioną postacią kryteriów Walda i optymistycznego. Bierze się tu
pod uwagę tak zarówno wypłatę najlepszą (największą) z możliwych, jak i najgorszą (najmniejszą). Dla wyrażenia wagi zainteresowania wypłatą najlepszą i najgorszą wprowadza się tzw.
współczynnik optymizmu - α.
B.1. NARZĘDZIA WSPOMAGANIA DECYZJI W WARUNKACH NIEPEWNOŚCI - KRYTERIA WYBORU
STRATEGII W GRZE PRZECIWKO NATURZE
81
Kryterium Hurwicza (w postaci szczególnej) zdefiniowane jest przez następujące zadanie
optymalizacji:
max{α · max VjA (ai ) + (1 − α) · min VjA (ai ) : i ∈ IA }.
j
j
(B.6)
Sformułowanie ogólne wymaga rozpatrzenia dwóch przypadków: parzystej i nieparzystej liczby strategii gracza B. Przyjmiemy następujące oznaczenia.
WJ
= α · θJ (VA (ai )) + (1 − α) · θ1 (VA (ai ))
WJ−1 = α · θJ−1 (VA (ai )) + (1 − α) · θ2 (VA (ai ))
WJ−2 = α · θJ−2 (VA (ai )) + (1 − α) · θ3 (VA (ai ))
...
Dla parzystej liczby strategii gracza B ostatnim elementem będzie
WJ− J +1 = α · θJ− J +1 (VA (ai )) + (1 − α) · θ J (VA (ai ))
2
2
2
a dla nieparzystej liczby strategii:
WJ− J−1 = α · θJ− J−1 (VA (ai )) + (1 − α) · θ J+1 (VA (ai )) = θJ− J−1 (VA (ai ))
2
2
2
2
Wówczas ogólnie dla parzystej liczby strategii gracza B kryterium Hurwicza definiujemy jako
następujące zadanie optymalizacji leksykograficznej:
lexmax{WJ , WJ−1 , ..., WJ− J +1 : i ∈ IA },
(B.7)
2
natomiast dla nieparzystej liczby strategii gracza B
lexmax{WJ , WJ−1 , ..., WJ− J−1 : i ∈ IA }.
(B.8)
2
B.1.4
Kryterium Laplace’a
Jest to procedura wyboru strategii, skupiająca uwagę na wartości oczekiwanej wypłaty, jaką
może uzyskać gracz (A) wybierając daną strategię. Ponieważ brak jest informacji o macierzy
wypłat gracza konkurencyjnego (B), to z konieczności trzeba założyć, iż z równym prawdopodobieństwem gracz ten wybrać może każdą ze swoich strategii1 . W tym przypadku - gdy prawdopodobieństwa wyboru danych strategii przez konkurenta są jednakowe (lub z braku informacji
przyjęte jako takie) - strategia maksymalizująca wartość oczekiwaną wypłaty, jest tożsama ze
strategią maksymalizującą sumę (po wszystkich strategiach konkurenta) wypłat.
Kryterium Laplace’a wyrazimy zależnością
max{
1
J
1X
V A (ai ) : i ∈ IA },
J j=1 j
Bez tego założenia byłoby to równoznaczne z tworzeniem informacji, której się nie posiada.
(B.9)
lub prościej
max{
J
X
VjA (ai ) : i ∈ IA }.
(B.10)
j=1
Sformułowaniem ogólnym kryterium Laplace’a jest przypadek rozpatrywania sumy tylko
kilku wybranych, największych bądź najmniejszych wypłat dla każdej strategii. I tak dla przypadku rozpatrywania sumy k największych wypłat, kryterium Laplace’a wyrazimy zależnością
k−1
X
max{
θJ−j (VA (ai )) : i ∈ IA },
(B.11)
j=0
natomiast dla przypadku sumy k najmniejszych wypłat, zależnością:
max{
k
X
θj (VA (ai )) : i ∈ IA }.
(B.12)
j=1
Warto zauważyć, iż szczególnym przypadkiem (dla k = 1) kryterium Laplace’a postaci (B.11)
będzie kryterium Optymistyczne (B.4), a dla postaci (B.12) kryterium Walda (B.1).
B.1.5
Kryterium Savage’a
Kryterium to opiera się na obserwacji, iż w niektórych przypadkach wartość otrzymanej wypłaty
ocenia się nie pod kątem jej bezwzględnej wartości, ale w porównaniu z najlepszą możliwą do
osiągnięcia wypłatą, przy założeniu ustalonej strategii konkurenta. Jest to wyrazem tendencji
do minimalizowania poczucia straty (utraconej korzyści). Dla każdej możliwej decyzji gracza B
określa się wielkość straty - w stosunku do wartości najlepszej - jaką poniósłby gracz A wybierając
daną strategię. Wartość straty gracza A (przy ustalonej strategii gracza B - j), określana jest tu
jako różnica maksymalnej wypłaty Vj max , jaką otrzymać mógłby gracz A i wypłaty, jaką otrzyma
wybierając strategię i. Funkcję, która każdej wartości wypłaty z macierzy wypłat przyporządkuje
wartość straty, nazywali będziemy funkcją straty.
Maksymalną wypłatę gracza A, przy ustalonej strategii j gracza B wyznaczyć można z
zależności
VjAmax = max VjA (ai ).
i
(B.13)
Natomiast funkcja straty wyrażać się będzie zależnością
VejA (ai ) = VjAmax − VjA (ai ).
(B.14)
Zależność (B.14) pozwala nam przekształcić oryginalną macierz wypłat na macierz strat.
Kryterium Savage’a wskazuje na taką strategię, która minimalizuje maksymalną stratę. Jest
to więc strategia minmaxowa dla macierzy strat
min{max VejA (ai ) : i ∈ IA }.
j
(B.15)
83
Ogólnie kryterium Savage’a wyraża się zależnością
e A (ai )), θJ−1 (V
e A (ai )), ...θ1 (V
e A (ai )) : i ∈ IA }.
lexmin{θJ (V
B.1.6
(B.16)
Kryterium maksymalizacji liczby największych wygranych (LNW)
Pod pojęciem największej wygranej rozumieli będziemy wypłatę, której w macierzy strat odpowiada wartość zerowa. Kryterium LNW stosuje się w sytuacjach, kiedy gracz dąży nie tyle do
minimalizacji wartości straty, jak to było w przypadku kryterium Savage’a, lecz do minimalizacji prawdopodobieństwa, że w ogóle takiej straty się doświadczy. Innymi słowy kryterium to
wskazuje na tę strategię, która zawiera najwięcej takich wartości wypłat, którym w macierzy
strat odpowiada wartość zerowa.
Wprowadźmy przekształcenie Φ, takie że:

 1 dla x ¬ 0
Φ(x) =
 0 dla x > 0
Przekształcenie Φ może być sformułowane w bardzo różny sposób. Jeden z nich ilustruje
zależność
Φ(x) =
sign(−x) + 1
,
2
(B.17)
gdzie funkcja sign(x) to funkcja signum, zwracająca wartość +1 dla x 0 oraz −1 dla x < 0.
Korzystając z przekształcenia Φ możemy przedstawić kryterium LNW w postaci
max{
X
Φ(VejA (ai )) : i ∈ IA }
(B.18)
j
B.1.7
Kryterium maksymalizacji liczby największych wygranych z progiem
uznania (LNWP)
Kryterium LNW postaci (B.18) brało pod uwagę tylko te wartości wypłat, którym w macierzy
strat odpowiadała wartość zerowa, czyli w ścisłym tego słowa znaczeniu wygrane największe. W
kryterium LNWP (LNW z progiem uznania), prócz wartości wypłat największych wygranych
brali będziemy dodatkowo pod uwagę te wypłaty, które mimo że w danej kolumnie macierzy
wypłat nie są największe, to są na tyle zbliżone do wypłat największych, że za największe
skłonni jesteśmy je uznać.
Zmodyfikujmy postać punkcji Φ. Dla progu bezwzględnego będzie ona miała teraz postać

 1 dla x ¬ ρ
Φ(x, ρ) =
,
 0 dla x > ρ
natomiast dla progu względnego postać

 1 dla
Φ(x, ρ, xmax ) =
 0 dla
x
xmax
x
xmax
¬ρ
>ρ
Przykładowe postaci zmodyfikowanej funkcji Φ ilustrują zależności (B.19), (B.20).
sign(ρ − x) + 1
(B.19)
2
x
sign(ρ − xmax
)+1
Φ(x, ρ, xmax ) =
(B.20)
2
Wobec powyższego kryterium maksymalizacji liczby największych wygranych LNWP z bezΦ(x, ρ) =
względnym progiem uznania zdefiniujemy zależnością
X
max{
·Φ(VejA (ai ), ρ) : i ∈ IA }
(B.21)
j
natomiast kryterium maksymalizacji liczby największych wygranych LNWP ze względnym progiem uznania zależnością
X
max{
·Φ(VejA (ai ), ρ, VjAmax ) : i ∈ IA }
(B.22)
j
B.1.8
Kryterium maksymalizacji sumy największych wypłat z progiem uznania (SNWP)
Istotą kryterium SNWP jest maksymalizacja sumy tych wypłat, którym w macierzy strat odpowiada wartość zerowa (największych wypłat), bądź taka, którą uznać możemy za pomijalnie małą.
Motywacja gracza do wyboru danej strategii opiera się tu zatem z jednej strony na chęci unikania
strat (minimalizacji prawdopodobieństwa, że ona wystąpi), a z drugiej strony na maksymalizacji wartości oczekiwanej wypłaty Jest to zatem swoista hybryda kryterium LNW i Laplace’a.
Analogicznie jak dla kryterium LNWP, w kryterium SNWP przyjmiemy zatem, iż daną wypłatę
uznawali będziemy za największą wygraną, jeśli jej wartość będzie mniejsza od faktycznie największej wygranej w tej samej kolumnie o wartość nie przekraczającą wartości progu uznania ρ.
Korzystając z wprowadzonej już definicji funkcji Φ z bezwzględnym progiem uznania (B.19), oraz
ze względnym progiem uznania (B.20), kryterium maksymalizacji sumy największych wygranych
SNWP z bezwzględnym progiem uznania zdefiniujemy zależnością
X
max{
VjA (ai ) · Φ(VejA (ai ), ρ) : i ∈ IA }
(B.23)
j
natomiast kryterium maksymalizacji sumy największych wygranych SNWP ze względnym progiem uznania zależnością
X
max{
j
VjA (ai ) · Φ(VejA (ai ), ρ, VjAmax ) : i ∈ IA }
(B.24)
85
B.1.9
Kryterium maksymalizacji wartości oczekiwanej wypłaty z progiem
uznania (EWP)
Idea jest tu następująca. Przyjmujemy, iż gracz w swych decyzjach kieruje się kryterium maksymalizacji wartości oczekiwanej wypłaty (kryterium Laplace’a). Nie wszystkie wartości wypłat
skłonny jest on jednakże traktować jako wygraną. Zakładamy, że interesują go tylko określone
wartości wypłat, większe niż pewna wartość v, i tylko te jest on w stanie akceptować jako
rzeczywistą wygraną. Wypłaty mniejsze niż v nie stanowią dla gracza żadnej wartości. Po przez
analogię do kryterium SNWP wartość v nazywali będziemy progiem uznania. Różnica pomiędzy
progiem ρ z kryterium SNWP, a wprowadzonym tu progiem v jest taka, iż próg ρ określa minimalną wartość straty, którą jesteśmy skłonni jeszcze za stratę uważać, natomiast próg v określa
minimalną wartość wypłaty, którą skłonni jeszcze jesteśmy uznać za wygraną. Wprowadźmy
zatem funkcję Ψ(x, v) o następujących właściwościach:

 1 dla x v
Ψ(x, v) =
 0 dla x < v
Przykładową postać funkcji Ψ(x, v) ilustruje zależność
Ψ(x, v) =
sign(x − v) + 1
.
2
(B.25)
Korzystając z wprowadzonej funkcji Ψ(x, v), kryterium maksymalizacji wartości oczekiwanej
z progiem uznania EWP wyrazimy zależnością
max{
X
VjA (ai ) · Ψ(VjA (ai ), v) : i ∈ IA }
(B.26)
j
Kryterium to jest zatem uogólnieniem kryterium wartości oczekiwanej Laplace’a. Kryterium
Laplace’a otrzymujemy podstawiając za próg uznania v wartość mniejszą bądź równą najmniejszej wartości wypłaty w macierzy wypłat.
B.1.10
Kryterium minimalizacji wartości oczekiwanej straty z progiem uznania (ESP)
Poprzez analogię do kryterium maksymalizacji wartości oczekiwanej wypłaty z progiem uznania
EWP, wprowadzimy kryterium minimalizacji wartości oczekiwanej straty z progiem uznania.
Zakładamy tu, że za stratę uważamy tylko wartości większe niż próg v. Korzystając z funkcji
straty, zdefiniowanej zależnością (B.14), oraz funkcji Ψ postaci (B.25), kryterium ESP wyrazimy
zależnością
min{
X
j
VejA (ai ) · Ψ(VejA (ai ), v) : i ∈ IA }.
(B.27)
Ponieważ kryterium maksymalizacji sumy wypłat (Laplace’a) jest tożsame z kryterium minimalizacji sumy strat (Expected Opportunity Loss), zatem kryterium ESP interpretować możemy jako
maksymalizację sumy wypłat, dla których jest zauważalna (większa niż v) strata. Tu wyłania się
subtelna różnica pomiędzy kryterium maksymalizacji sumy największych wygranych z progiem
uznania SNWP, maksymalizacji wartości oczekiwanej wypłaty z progiem uznania EWP i minimalizacji wartości oczekiwanej straty z progiem uznania ESP, którą, jak to zostało powiedziane,
interpretować można jako maksymalizację sumy wypłat, dla których jest zauważalna strata.
Różnice nakreśla poniższe zestawienie.
kryterium
działanie
EWP
maksymalizuje sumę wypłat uznanych za wygraną
ESP
maksymalizuje sumę wypłat, dla których jest zauważalna strata
SNWP
maksymalizuje sumę wypłat, dla których strata jest niezauważalna
B.1.11
Kryterium maksymalizacji progowej wartości oczekiwanej wypłaty
(PEW)
Kryterium maksymalizacji wartości oczekiwanej wypłaty z progiem uznania EWP (B.26) daje w
szczególnym przypadku różne rozwiązania w zależności od tego, jaką przyjmie się wartość progu
v. Dla przykładu, gdyby dla macierzy wypłat, jak w tabeli ?? przyjąć wartość progu uznania
v równą nie 2, lecz 3, wówczas kryterium to wskazałoby już nie na strategię a2 lecz a1 , a dla
v = 5, strategię a4 . Stąd pomysł stworzenia kryterium, które przy wyborze strategii brałoby
pod uwagę wszelkie możliwe i sensowne wartości progów. Kryterium to jest użyteczne wówczas,
kiedy gracz nie jest w stanie a priori ustalić właściwej wartości progu uznania.
Przyjmijmy zatem, że wartość progu v zmieniała się będzie od wartości najmniejszej do
największej - patrząc na wartości wypłat w macierzy wypłat, zgodnie z krokiem o wartości v.
Kryterium maksymalizacji progowej wartości oczekiwanej wypłaty PEW zdefiniujemy wówczas
zależnością
XX
max{
VjA (ai ) · Ψ(VjA (ai ), k · v) : i ∈ IA }.
(B.28)
j
k
W przypadku, gdyby przewidywano, iż poszczególne wartości progów k · v występować miały
z prawdopodobieństwem pk , wówczas kryterium PEW można przekształcić do postaci
max{
XX
k
B.1.12
pk · VjA (ai ) · Ψ(VjA (ai ), k · v) : i ∈ IA }.
(B.29)
j
Kryterium minimalizacji progowej wartości oczekiwanej straty (PES)
Kryterium minimalizacji wartości oczekiwanej straty z progiem uznania ESP (B.27) daje w
szczególnym przypadku różne rozwiązania w zależności od tego, jaką przyjmie się wartość progu
B.2. NARZĘDZIA WSPOMAGANIA DECYZJI W WARUNKACH RYZYKA
87
v. Kryterium minimalizacji progowej wartości oczekiwanej straty PES, analogicznie do kryterium
maksymalizacji progowej wartości oczekiwanej wypłaty PEW rozpatruje wszelkie możliwe progi
uznania, agregując - poprzez sumowanie po progach - otrzymane rozwiązania. Kryterium PES
definiujemy zależnością
min{
XX
k
VejA (ai ) · Ψ(VejA (ai ), k · v) : i ∈ IA }
(B.30)
j
Definicja kryterium (B.30) uwzględnia próg uznania w sensie bezwzględnym, tzn. bez odniesienia do wartości maksymalnej Vj max . W przypadku operowania na macierzy strat, bardziej
właściwym wydaje się odwoływanie się do progów względnych. Dlatego też proponujemy dodatkową postać kryterium PES ze względnym progiem uznania, postaci
min{
XX
VejA (ai ) · Ψ(VejA (ai ), k · v, VjAmax ) : i ∈ IA }.
(B.31)
j
k
Funkcja Ψ przybiera tu trzy argumenty i zdefiniowana jest zależnością
Ψ(x, v, xmax ) =
x
sign( xmax
− v) + 1
.
2
(B.32)
W przypadku, gdyby przewidywano, iż poszczególne wartości progów k · v występować miały
z prawdopodobieństwem pk , wówczas kryterium PES można przekształcić do postaci
XX
min{
k
pk · VejA (ai ) · Ψ(VejA (ai ), k · v, VjAmax ) : i ∈ IA }.
(B.33)
j
Kryterium PES, podobnie jak to było w przypadku kryterium PEW, użyteczne jest wówczas,
kiedy gracz nie jest w stanie a priori ustalić właściwej wartości progu uznania. Ponadto warto
zauważyć, iż mimo, że zastosowanie kryterium maksymalizacji wartości oczekiwanej wypłaty
(Laplace’a) daje w wyniku zawsze tę samą strategię co kryterium minimalizacji wartości oczekiwanej straty (Expected Opportunity Loss), to w przypadku kryteriów progowych PEW i PES
tak już nie jest.
B.2
Narzędzia wspomagania decyzji w warunkach ryzyka
Różnica pomiędzy sytuacją wyboru decyzji w warunkach niepewności a ryzyka jest taka, że
określone prawdopodobieństwa (występowania określonych stanów natury, wyboru określonych
strategii przez konkurentów, wybrania określonego typu jako typu aktywnego w grze – ogólnie
scenariuszy) przyjmują różną wartość. Założenie, że prawdopodobieństwa te przyjmują różną
wartość idzie w parze z założeniem, że są one znane, a więc, że są znane prawdoopodobieństwa pi zaistnienia poszczególnych scenariuszy yi . Klasycznym sposobem podejścia do tego typu
sytuacji jest zamiana modelu prawdopodobieństwo-scenariusz na model logerii, w której liczaba
wystąpień określonego scenariusza odpowiada wartości przypisanego mu prawdopodobieństwa.
Uzyskuje się w ten sposób problem wielokryterialny.
Tematyka wspomagania decyzji w warunkach ryzyka ma już swoją bogatą literaturę (zobacz
np. [38]). Wypracowano też w tym względzie wiele podejść takich jak. metoda Markowitza, metoda dystrybuanty referencyjnej, agregacja OWA. Szczegółowy opis tych i innych metod znaleźć
można w pracy [66].
Dodatek C
John’a C. Harsanyi: Dwustronne
negocjacje w sytuacji nieznajomości
funkcji użyteczności kontrpartnera w
grze.
C.1
Próba ustalenia wartości punktu zgody
W negocjacjach, a bardziej ogólnie we wszystkich nie trywialnych sytuacjach o charakterze
strategicznych interakcji (sytuacje gry), zachowanie racjonalnego gracza zależy od tego, czego
spodziewa się on odnośnie zachowania drugiej stron. Gracz 1 zabiega o najlepsze z możliwych
warunków, o jakich akceptacji spodziewa się ze strony gracza 2. Jednakże gracz 1 wie, że warunki
na jakie zgodzi się gracz 2 zależą z kolei od tego, czego gracz 2 spodziewa się od gracza 1,
akceptację jakich warunków ze strony gracza 1 ma nadzieję uzyskać. Stąd zachowanie gracza 1
zależy od tego, co określić można oczekiwaniem (przypuszczeniem) drugiego rzędu (second-order
expectation), tzn. zależy od przypuszczeń gracza 1 odnośnie przypuszczeń gracza 2 związanych z
zachowaniem się gracza 1 (możliwych do zaakceptowania przez niego, tj. gracza 1 warunków). To
z kolei zależy od oczekiwań trzeciego rzędu gracza 1 odnośnie oczekiwań drugiego rzędu gracza
2 itd.
Wprowadźmy następujące oznaczenia1 . Niech A1 i A2 oznaczają punkty zgody odpowiednio
gracza 1 i 2. Punkt zgody oznacza najgorsze warunki, na które dany gracz jest gotów w trakcie
negocjacji się zgodzić 2 . Niech operator e1 oznacza „estymację lub przypuszczenie gracza 1
1
2
W tej części pracy przyjmujemy oryginalną notację przyjętą przez Harsanyi w pracy [28].
Harsanyi nie definiuje punktów zgody A1 i A2 jako wartości opartych na najlepszej alternatywie dostępnej
89
DODATEK C. JOHN’A C. HARSANYI: DWUSTRONNE NEGOCJACJE W SYTUACJI NIEZNAJOMOŚCI
FUNKCJI UŻYTECZNOŚCI KONTRPARTNERA W GRZE.
90
odnośnie określonej wartości”. Analogicznie e2 oznacza „estymację lub przypuszczenie gracza 2
odnośnie określonej wartości”.
Nasze dotychczasowe rozumowanie może być teraz wyrażone w sposób następujący. Gracz 1
wybierze swój punkt zgody A1 w oparciu o swoje przypuszczenie (estymację) odnośnie punktu
zgody graca A2 . Innymi słowy A1 zależy od e1 A2 . Jednakże gracz 2 wybierze swój punkt zgody
A2 w oparciu o przypuszczenie (estymację) punktu zgody gracza A1 . Stąd A2 zależy od e2 A1 .
Ponieważ gracz 1 wie, że A2 zależy od e2 A1 , swoje przypuszczenie odnośnie pierwszego
składnika (A2 ) oprze na przypuszczeniu odnośnie drugiego (e2 A1 ). Stąd e1 A2 zależy od e1 e2 A1 .
Rozumując analogicznie stwierdzić można, że e2 A1 zależy od e2 e1 A2 .
Ponieważ gracz 1 wie, że e2 A1 zależy od e2 e1 A2 , to swoje przypuszczenie (estymację) odnośnie
pierwszego (e2 A1 ) znowu uzależni od swojego przypuszczenia odnośnie drugiego (e2 e1 A2 ). Stąd
e1 e2 A1 będzie zależało od e1 e2 e1 A2 . Rozumując analogicznie e2 e1 A2 będzie zależało od e1 e1 e2 A1
itd.
Podsumowując:
A1 zależy od e1 A2
e1 A2 zależy od e1 e2 A1
e1 e2 A1 zależy od e1 e2 e1 A2 , itd3 .
Stąd też analiza sytuacji decyzyjnej gracza 1 w kontekście próby ustalenia właściwej wartości punktu zgody prowadzi do nieskończonej sekwencji A1 (n) złożonych przypuszczeń, gdzie
nieparzyste elementy sekwencji przyjmują postać:
A1 (n) = A1 (2k − 1) = (e1 e2 )k−1 A1 ,
(C.1)
A1 (n) = A1 (2k) = (e1 e2 )k−1 e1 A1 .
(C.2)
natomiast elementy parzyste:
Kłopot tu tkwi jednak w tym, że każdy element tej nieskończonej sekwencji A1 (n) zależy od
elementu następnego A1 (n + 1), co w oczywisty sposób prowadzi do nieskończonej regresji.
poza stołem negocjacyjnym, czyli BATNA (Best Alternative To a Negotiated Agreement) graczy [18, 71, 75, 76,
92, 95], co bywa określane jako punkt rezerwacji [96, 98, 100, 101]. Wartości punktów zgody w ujęciu Harsanyi
zależą jedynie od analizy sytuacji (i dostępnych rozwiązań) przy stole negocjacyjnym, a jeszcze ściślej mówiąc, od
spodziewanej wartości punktu zgody kontrpartnera.
3
Odzwierciedla to następujące rozumowanie: wartość mojego (gracza 1) punktu zgody, krócej „moja wartość”
zależy od twojej (gracza 2) wartości (twojego punktu zgody), a ściślej od tego, co ja o niej myślę (e1 ). Jednak
twoja wartość zależy od tego co ty myślisz (e2 ) na temat mojej wartości. Czyli moje myślenie (e1 ) na temat twojej
wartości zależne jest od mojego myślenia na temat tego, co ty myślisz (e1 e2 ) o mojej wartości. To z kolei, co ty
myślisz (e2 ) o mojej wartości, zależne jest od tego, co myślisz, że ja myślę (e2 e1 ) o twojej wartości. Czyli moje
myślenie na temat twojego myślenia (e1 e2 ) o mojej wartości, zależne jest od mojego myślenia, na temat twojego
myślenia o tym, co ja myślę (e1 e2 e1 ) o twojej wartości. Itd.
C.2. ARBITRAŻOWE ROZWIĄZANIE ZUETHEN’A-NASH’A W PRZYPADKU ZNAJOMOŚCI FUNKCJI
UŻYTECZNOŚCI
91
Oczywiście analiza sytuacji decyzyjnej gracz 2 w kontekście próby ustalenia wartości punktu
zgody A2 prowadzić będzie do podobnych wniosków.
C.2
Arbitrażowe rozwiązanie Zuethen’a-Nash’a w przypadku znajomości funkcji użyteczności
Jednym z istotnych osiągnięć teorii gier w ogólności, a w szczególności teorii gier negocjacyjnych
(bargaining games) Zeuthen’a-Nash’a jest pokazanie, w jaki sposób wyżej omówiona nieskończona regresja skomplikowanych przypuszczeń może zostać w sposób analityczny rozwiązana.
Rozwiązanie to jest osiągnięte w szczególności poprzez sformułowania pewnych warunków równowagi (equilibrium conditions) lub poprzez żądanie konwekwencji (consistency requirements), które
przypuszczenia racjonalnych graczy muszą spełniać, w ramach rozważań na temat wzajemnego
zachowania.
W szczególności, teoria Zeuthen’a-Nash’a zakłada, że dany gracz nie będzie oczekiwał od
drugiego gracza ustępstwa, na które sam by się nie zgodził. Fakt ten nakłada warunek silnej symetrii na strategie, które w sposób racjonalny mogłyby być wybrane przez każdego z
graczy, oczekującego od kontrpartnera równie racjonalnego zachowania. Ten postulat symetrii, w
połączeniu z kilkoma innymi bardzo naturalnymi postulatami racjonalnego zachowania4 prowadzi
do wskazania jednoznacznego5 rozwiązania, będącego jednocześnie punktem równowagi (equilibrium agreement point) – A∗ , dla każdej konkretnej gry negocjacyjnej Γ.
W sposób matematyczny rozwiązanie Zeuthen’a-Nash’a może być zdefiniowane w sposób
następujący. Niech u1 i u2 będą funkcjami użyteczności odpowiednio gracza 1 i gracza 2. Niech
C będzie rozwiązaniem dostępnym dla obu graczy w sytuacji, gdyby nie zawarli w trakcie negocjacji porozumienia. Niech A będzie zbiorem wszystkich możliwych rozwiązań A dostępnych w
trakcie negocjacji. Wówczas rozwiązanie A∗ jest takim szczególnym rozwiązaniem (porozumieniem zawartym w trakcie negocjacji) A, które maksymalizuje następującą funkcję (iloczyn):
π0 = π(u1 , u2 ) = [u1 (A) − u1 (c)] · [u2 (A) − u2 (C)]
(C.3)
z zachowaniem warunku:
A∈A
4
Prócz postulatu symetrii, mowa jest tu jeszcze o postulacie racjonalności (czy pareto-optymalności), nieza-
leżności od przekształceń liniowych oraz niezależności od opcji nieistotnych (czy inaczej alternatyw niezależnych)
[64, 73, 83].
5
Badania prowadzone przez innych badaczy w kwestii poszukiwania rozwiązania gry negocjacyjnej (co bywa
nazywane problemem arbitrażu) pokazały, że takich rozwiązań racjonalnie i naturalnie uzasadnionych może być
więcej [55, 71, 98, 101] i że nie muszą być one tożsame.
92
ui (A) ui (C)
[i = 1, 2]
Zakładając, że obaj gracze znają nawzajem swoje funkcje użyteczności, nieskończona regresja
złożonych przewidywań w tym miejscu znika. Wynika to z faktu, że jeśli obaj gracze podążają za postulatami racjonalności Zeuthen’a-Nash’a, to zaakceptują i będą oczekiwali akceptacji
od drugiej strony rozwiązania A∗ jako rozwiązania negocjowanego przez nich problemu. Stąd
otrzymujemy:
C.3
A1 = e2 A1 = e1 e2 A1 = e2 e1 e2 A1 = . . . = A∗
(C.4)
A2 = e1 A2 = e2 e1 A2 = e1 e2 e1 A2 = . . . = A∗ .
(C.5)
Estymacja arbitrażowego rozwiązania Zeuthen’a-Nash’a w
przypadku nieznajomości funkcji użyteczności
Podczas gdy rozwiązanie Zeuthen’a-Nash’a stanowi rozwiązanie problemu złożonych przypuszczeń
w przypadku, gdy obie strony negocjacji znają nawzajem swoje funkcje wypłaty, to problem
powraca w nieco odmiennej formie wówczas, gdy rozluźnimy założenie o wzajemnie znanych
funkcjach użyteczności.
Przyjmijmy, że obaj gracze (negocjatorzy) kierują się i wzajemnie spodziewają się kierowania postulatami teorii Zeuthen’a-Nash’a oraz, że nie znają nawzajem swoich funkcji wypłaty.
Załóżmy jednak, że obaj gracze formułują jednowartościowe estymaty funkcji wypłaty i innych
nieznanych sobie zmiennych charakteryzujących drugiego gracza. Oczywiście, generalnie te estymaty nie muszą być zgodne z rzeczywistymi wartościami tych zmiennych6 .
Przy takim podejściu, gracz 1 może spróbować wybrać swój punkt zgody A1 poprzez maksymalizację funkcji π0 = π(u1 , u2 ) zdefiniowanej zależnością (C.3). Jednakże ponieważ gracz 1 nie
zna funkcji u2 , to wszystko co może zrobić to maksymalizacja funkcji π1 = π(u1 , e1 u1 ), w której
jego mniej lub bardziej niedokładna estymata e1 u2 zastępuje prawdziwą funkcję użyteczności
u2 gracza 2. Stąd faktycznie A1 będzie punktem, dla którego maksymalną wartość przyjmuje funkcja π(u1 , e1 u2 ). Tę wartość A1 możemy traktować jako estymatę gracza 1 rzeczywistego
rozwiązania Zeuthen’a-Nash’a A∗ , co zapisać można zależnością:
A1 = e1 A∗ .
6
(C.6)
Ten sam wniosek uzyskamy wówczas, gdy uczynimy bardziej ogólne założenie, że gracze nie formułują
jednowartościowej estymaty, ale że każdy z nich wyznacza subiektywny rozkład wspólnych prawdopodobieństw
odnośnie zmiennych sobie nieznanych i wówczas próbuje maksymalizować wartość oczekiwaną użyteczności w
oparciu o ten rozkład prawdopodobieństwa.
C.3. ESTYMACJA ARBITRAŻOWEGO ROZWIĄZANIA ZEUTHEN’A-NASH’A W PRZYPADKU
NIEZNAJOMOŚCI FUNKCJI UŻYTECZNOŚCI
93
Podobnie punkt zgody A2 gracza 2 będzie punktem gdzie maksymalizowana jest funkcja
π2 = π(e2 u1 , u2 ), co interpretować można jako estymatę gracza 2 rzeczywistego rozwiązania
Zeuthen’a-Nash’a A∗ :
A2 = e2 A∗ .
(C.7)
Jednakże bardziej wyrafinowani gracze mogą rozegrać lepiej, niż to wyżej zostało zarysowane.
Gracz 1 wie, że gracz 2 faktycznie wybiera swój punkt zgody w oparciu o maksymalizację
funkcji (iloczynu) π2 nie zaś w oparciu o maksymalizację teoretycznie poprawnej funkcji π0 .
Dlatego też gracz 1 będzie starał się oszacować funkcje e2 u1 oraz u2 , użyte przez gracza 2 w
funkcji π2 , a następnie maksymalizował będzie iloczyn π21 = π(e1 e2 u1 , e1 u2 ), która wykorzystuje
estymaty e1 e2 u1 i e1 u2 tych dwu funkcji. Punkt A1 (2), w którym maksymalizuje się iloczyn
π21 reprezentuje teraz obliczoną przez gracza 1 estymatę punktu zgody A2 = e2 A∗ gracza 2.
Jednocześnie punkt ten będzie nowym, poprawionym punktem zgody gracza 1, ponieważ punkt
ten wyznacza maksymalny zakres ustępstw jaki musi poczynić gracz 1, aby nie doprowadzić
do zerwania negocjacji. Stąd nowy (poprawiony) punkt zgody gracza 1, który nazwać możemy
punktem zgody drugiego rzędu (second-order ) wyrazi się zależnością:
A1 (2) = e1 A2 = e1 e2 A∗ ,
(C.8)
który jest punktem w którym maksymalizuje się iloczyn π21 .
W podobny sposób przebiegać będzie rozumowanie gracza 2, jeśli kierował on będzie się tą
bardziej wyrafinowaną strategią wyboru poprawionego punktu zgody drugiego rzędu. Punkt ten
określić można w sposób następujący:
A2 (2) = e2 A1 = e2 e1 A∗
(C.9)
i w nim maksymalizuje się iloczyn π12 = π(e2 u1 , e2 e1 u2 ). Oczywiście gracz 1 może teraz kontynuować to wyrafinowane rozumowanie dążąc do określenia punktu zgody trzeciego rzędu A1 (3),
jako estymatę punktu zgody drugiego rzędu A2 (2) gracza 2:
A1 (3) = e1 e2 A1 = e1 e2 e1 A∗ ,
(C.10)
Punkt ten maksymalizował będzie iloczyn π121 = π(e1 e2 u1 , e1 , e2 , e1 , u2 ). Proces ten kontynuować można w nieskończoność.
Generalnie, punkt zgody n-tego rzędu gracza 1 przyjmie postać:
A1 (n) = A1 (2k − 1) = (e1 e2 )k−1 e1 A∗
(C.11)
A1 (n) = A1 (2k) = (e1 e2 )k A∗
(C.12)
dla n nieparzystego, i
94
dla n parzystego.
Ostatecznie, jedynym, w pełni satysfakcjonującym punktem zgody gracza 1 będzie punkt
graniczny Ā1 (granica) tej sekwencji A1 (n) – zakładając, że taka granica istnieje. Ā1 Harsanyi
nazywa ostatecznym punktem zgody (final concession point). Ostateczny punkt zgody gracza
2 definiuje się w analogiczny sposób. Oczywiście, przy założeniu takiej definicji ostatecznych
punktów zgody Ā1 i Ā2 , jako granicy sekwencji 1 (n) i 2 (n) zapisać można następujące zależności:
Ā1 = e1 Ā2 ,
(C.13)
Ā2 = e2 Ā1 .
(C.14)
Oznacza to, że ostateczny punkt zgody Ā1 gracza 1 musi odpowiadać jego przewidywaniu
odnośnie ostatecznego punktu zgody gracza 2 i vice versa.
Podobieństwo równań (C.11) i (C.12) do równań (C.1) i (C.2), w przypadku wzajemnie
znanych funkcji użyteczności jest oczywiste. Istnieje jednakże istotna różnica, jako że w równaniach (C.11) i (C.12) n-ty element sekwencji A1 (n) nie zależy od (n + 1)-ego elementu A1 (n + 1).
Zależy natomiast od oczekiwania wyższego rzędu gracza 1 (tj. jego oczekiwania odnośnie oczekiwania kontrpartnera) odnośnie oczekiwania danego rzędu związanego z funkcjami u1 i u2 . Stąd
problem nieskończonej regresji w tym miejscu nie występuje. Jednakże problem złożonych oczekiwań występuje w przedstawionej w następnym punkcie, nieco zmienionej formie.
C.4
Problem zbieżności i wzajemnej kompatybilności sekwencji
Ai (n)
W rzeczywistym świecie, sytuacje negocjacyjne, w ramach których strony posiadają bardzo
ograniczone informacje na temat wzajemnych funkcji użyteczności (tj. na temat wzajemnych
preferencji i stosunku do ryzyka) są bardzo powszechne. Jednakże zwykle każda ze stron obmyśla
swoją strategię gry, jak również określa wartość ostatecznych punktów zgody – Ā1 i Ā2 , które
odpowiadają ich przypuszczeniom na temat zachowania się kontrpartnera w grze. To zdaje się
pokazywać, że dla obu stron sekwencje A1 (n) i A2 (n) zwykle zbiegają się do pewnych dość dobrze
zdefiniowanych punktów Ā1 i Ā2 .
Istotnie, dość często obie strony zawierają porozumienie, tj. unikają wzajemnie niekompatybilnych żądań. To oznacza, że gracze ci nie tylko wybierają dobrze zdefiniowane, ale również
wzajemnie kompatybilne ostateczne punkty zgody Ā1 i Ā2 . Te przypadki zdają się zachodzić znaczenie częściej, niż wskazywać by na to mógł wybór przypadkowego losu. Rodzi to dwa
istotne pytania:
C.4. PROBLEM ZBIEŻNOŚCI I WZAJEMNEJ KOMPATYBILNOŚCI SEKWENCJI AI (N )
95
1. Jaki mechanizm sprawia, że dla każdego z graczy i (i = 1, 2) sekwencja Ai , Ai (2), . . . , Ai (n), . . .
zbiega się do dobrze zdefiniowanego punktu granicznego Āi , który staje się następnie punktem
zgody danego gracza w grze negocjacyjnej?
2. Jaki mechanizm sprawia, że ostateczne punkty zgody obu graczy Ā1 i Ā2 , reprezentujące
granice dwóch sekwencji A1 (n) i A2 (n), są wzajemnie kompatybilne?
Zdaniem Harsanyi odpowiedź na pytanie 1 zdaje się być bardzo prosta. Zbieżność sekwencji
Ai , Ai (2), . . . , Ai (n), . . . do określonej wartości Āi , może być wynikiem tego, że gracze wykonują
jedynie kilka pierwszych kroków tego ciągu rozumowania: jaka jest jego funkcja użyteczności ,
jaka jest jego estymata mojej funkcji użyteczności, jaka jest jego estymata mojej estymaty jego
funkcji użyteczności itd. Formalnie oznacza to, że Ai (n) staje się sekwencją stałą, po przebyciu
pierwszych, powiedzmy, k kroków i stąd z konieczności zbiega się do określonej wartości.
Ponadto, co stanie się bardziej oczywiste po przeczytaniu niżej przedstawionych argumentów,
mechanizm sprawiający, że ostateczne punkty zgody Ā1 i Ā2 są wzajemnie kompatybilne, również
pomaga w osiągnięciu zbieżności sekwencji Ai (n) do dobrze zdefiniowanego punktu Āi . Stąd
odpowiedź na pytanie 2 po części przyniesie też odpowiedź na pytanie 1.
Nawiązując do pytania 2, dwa mechanizmy zdają się prowadzić do tego, że ustalone niezależnie punkty zgody Ā1 i Ā2 są wzajemnie kompatybilne. Pierwszy mechanizm wynika, jak
można przypuszczać, z dobrze ugruntowanej tradycji kulturowej różnych społeczności, kształtującej oczekiwania graczy odnośnie własnej i drugiej strony funkcji użyteczności. Innymi słowy,
jest prawdopodobne, że wszyscy członkowie danej społeczności (lub precyzyjniej osoby tej tej
samej płci, wieku, pozycji społecznej, poziomu wykształcenia itp.) spodziewają się posiadania w istocie takiej samej czy bardzo podobnej funkcji użyteczności. Tę wykreowaną przez
społeczność i przypisaną jej członkom funkcję użyteczności u0 Harsanyi określa stereotypową
funkcją użyteczności.
Przy takim założeniu, w konkretnej grze negocjacyjnej, przykładowo gracz 1 wie, że gracz 2
oczekuje od niego posiadania pewnej stereotypowej funkcji użyteczności u01 , natomiast gracz 2
wie, że gracz 1 oczekuje od gracza 1 takiego oczekiwania, itd. Podobnie gracz 1 będzie oczekiwał
od gracza 2 posiadania pewnej stereotypowej (prawdopodobnie innej) funkcji użyteczności u02 .
Ten mechanizm – mechanizm zakładania istnienia stereotypowej funkcji użyteczności – nazwiemy
mechanizmem I.
Z drugiej strony założyć możemy, że kompatybilność punktów zgody Ā1 i Ā2 nie wynika z
uprzedniego założenia ich wartości (np. w oparciu o założenie istnienia stereotypowej funkcji
użyteczności) jeszcze przed rozpoczęciem negocjacji, ale że wynika z ich wzajemnego dostosowania w trakcie procesu negocjacji. Ten mechanizm określimy jako mechanizm II.
Oczywiście powszechne rozumienie procesu negocjacji jest zgodne z mechanizmem II. Pro-
96
ces negocjacji nie polega na wzajemnej wymianie „ultimatów” – ostatecznych ofert, ale raczej
na długotrwałej wymianie różnych tymczasowych propozycji i kontr-propozycji, nastawionej w
dużej mierze na zbadanie sytuacji drugiej strony. Jednakże w naszej analizie nie rozsądnym
byłoby pomijanie mechanizmu I, z tego względu, że sam mechanizm II działał będzie poprawnie
jedynie wówczas, gdy blefowanie (tj. zniekształcanie informacji na temat rzeczywistej wartości
własnego punktu zgody) w negocjacjach poddane jest efektywnej kontroli (co w rzeczywistych
warunkach zdaje się nie mieć miejsca).
Dla uzasadnienia tego stwierdzenia rozważmy sytuację negocjacyjną, w której blefowanie jest
w pełni dozwolone i niezwiązane z żadnymi karami. Przypuśćmy, że gracze 1 i 2 rozpoczynają negocjacje z całkowicie niekompatybilnymi punktami zgody Ā1 i Ā2 . Oznacza to, że gracz 1
planuje nie wycofywać się z punktu Ā1 ponieważ (błędnie) przypuszcza, że gracz 2 to rozwiązanie
zaakceptuje. Z drugiej strony gracz 2 planuje nie wycofywać się z punktu Ā2 , ponieważ (równie
błędnie) spodziewa się, że gracz 1 to rozwiązanie zaakceptuje. Przy takim założeniu, mimo, że
oba punkty zgody są niekompatybilne, gracze nie mają szansy zrewidować (poprawić) swoje
punkty zgody w trakcie procesu negocjacji. Oczywiście, każda ze stron zauważy, że w trakcie
negocjacji kontrpartner przejawia silniejszy opór niż się tego dany gracz spodziewał. Jednakże
traktował to będzie jako zwykły blef i do ostatniej minuty oczekiwał będzie zmiany jego punktu
zgody. Dlatego też tak długo dopokąd blefowanie jest dozwolone mechanizm II nie doprowadzi
do uzgodnienia rozwiązania, jeśli punkty zgody nie były kompatybilne przed rozpoczęciem negocjacji.
Dla kontrastu, mechanizm II byłby w tej sytuacji w pełni efektywny. Jeżeli gracz 2 spodziewał
by się od gracza 1 posiadania stereotypowej funkcji użyteczności u01 , gracz 1 miałby silną motywację do tego, by działać tak, jakby u01 była rzeczywistą jego funkcją użyteczności i to nawet
wówczas, jeśli jego rzeczywista funkcja u1 była by inna. Wynika to stąd, że jeśli jego rzeczywista
funkcja użyteczności nakazywałaby mu być twardszym w negocjacjach (żądać więcej) niż wskazywałaby mu na to stereotypowa funkcja u01 , gracz 1 miałby poważne trudności z przekonaniem
gracza 2, że jego twardsza postawa nie jest w istocie zwykłym blefem.
Z drugiej strony, jeśli jego rzeczywista funkcja użyteczności gracza 1 sugerowała by mu
żądanie mniej niż wskazywałaby na to stereotypowa funkcja użyteczności, to przekazywanie tej
informacji graczowi 2 nie byłaby w jego (gracza 1) interesie.
Podsumowując, w przypadku, gdy blefowanie w negocjacjach nie jest zabronione, jeśli obaj
gracze spodziewają się względem siebie stosowania stereotypowej funkcji użyteczności u0i , mimo,
że rzeczywiste ich funkcje użyteczności ui są różne, otrzymamy następujące zależności:
e2 u1 = e1 e2 u1 = e2 e1 e2 u1 = . . . = u01
(C.15)
e1 u2 = e2 e1 u2 = e1 e2 e1 u2 = . . . = u02
(C.16)
C.5. MODEL GRY UŁATWIAJĄCY DOPROWADZENIE DO KOMPLEMENTARNOŚCI PUNKTÓW
ZGODY, W PRZYPADKU DOPUSZCZENIA BLEFOWANIA
97
nawet, jeśli ui 6= u0i .
Stąd też, obie sekwencje A1 (n) i A2 (n) będą zbiegały się do wspólnego punktu A = Ā, który
będzie maksymalizował iloczyn π 0 = π(u01 , u02 ). (Bardziej precyzyjnie rzecz ujmując, podczas gdy
pierwszy element tych sekwencji może być różny od Ā, to każdy następny będzie jemu równy).
C.5
Model gry ułatwiający doprowadzenie do komplementarności punktów zgody, w przypadku dopuszczenia blefowania
Harsanyi podaje następujący sposób wprowadzenia kary za blefowanie, zapożyczony od Roberta
J. Aumanna. Proces negocjacji zostaje podzielony na n etapów. Na każdym z etapów k, obaj
gracze wiedzą, że negocjacje zostaną przerwane, jeśli ich wzajemne oferty B1 (k) i B2 (k) będą
oddalone od siebie na odległość większą niż D(k). Na pierwszym etapie negocjacji tolerowane
są nawet bardzo duże różnice pomiędzy ofertami graczy, tzn. D(1) jest duże. Jednakże w
późniejszych etapach (przy zwiększaniu k) D(k) stopniowo maleje, aż do zrównania się w ostatnim n-tym kroku z wartością 0 (D(n) =)), co oznacza, że obaj gracze muszą zaakceptować te
same warunki, jeśli chcą zawrzeć porozumienie.
W ramach tego modelu ciągle pozostaje prawdą, że w dowolnym momencie, punkt zgody
– powiedzmy gracza 1 – Ā1 przyjmie wartość równą przewidywanej przez gracza 1 wartości
punktu zgody gracza 2, tj. Ā1 = e1 Ā2 (patrz równanie (C.13)). Jednakże na etapie k-tym gracz
1 wie, że może bezpiecznie złożyć ofertę B1 (k) o D(k) dla siebie korzystniejszą niż Ā1 = e1 Ā2 .
W tym zakresie będzie mógł więc blefować. Jednakże jego kontrpartner, gracz 2 będzie w pełni
świadomy tego i będzie wiedział, że prawdziwy punkt zgody gracza 1 położony jest o odległość
D(k) od jego oferty B1 (k). Oznacza to, że na etapie (k + 1), gracz 2 będzie wiedział gdzie leżał
punkt zgody Ā1 gracza 1, na poprzednim etapie, tj. etapie k. Podobnie, gracz 1 będzie wiedział,
gdzie leżał prawdziwy punkt zgody gracza 2 na poprzednim etapie.
Oczywiście, żaden z graczy nie będzie dokładnie widział gdzie na danym etapie gry znajduje
się punkt zgody jego kontrpartnera, ponieważ żaden z graczy nie wie, jak jego ostatnia oferta
wpłynęła na wartość rzeczywistego punktu zgody kontrpartnera. Jednakże wiedząc w jaki sposób
punkt zgody kontrpartnera przesuwał się w trakcie kolejnych etapów negocjacji, obaj będą w
stanie w najgorszym razie odgadywać (w oparciu o konkretne informacje), i przypuszczalnie w
ostatnim, n-tym etapie (jeśli nie wcześniej), będą wiedzieli dostatecznie dużo na temat tego,
jakie ostateczne oferty mogą złożyć bez zbyt dużego ryzyka odrzucenia ich.
Tak więc w ramach tego modelu mechanizm II może działać zupełnie poprawnie. Nawet
jeśli obie strony rozpoczęły negocjacje ze wzajemnie nieprzystającymi oczekiwaniami, istnieje
duża szansa, że na koniec tego n-etapowego procesu negocjacji ich wzajemne oczekiwania będą
98
bardziej spójne. Oczywiście dostępność mechanizmu I jest tu pomocna, tzn. jeśli obie strony
rozpoczęły negocjacje z niezbyt rozbieżnymi (bo opartymi na stereotypowych funkcjach użyteczności) oczekiwaniami, to istnieje mniejsze niebezpieczeństwo, że już w pierwszym etapie różnica
pomiędzy ich ofertami przekroczy dozwolony dystans D(1) i przypuszczalnie ustalenie wspólnie
akceptowalnego punktu zgody zajmie mniej etapów.
Pełna efektywność mechanizmu II zależy jednakże od aktualnych założeń przyjętych w modelu. W większości realnych sytuacji negocjacyjnych prawdopodobnie istnieje coś w rodzaju
tolerowalnej odległości D(k) pomiędzy ofertami składanymi przez graczy i negocjacje zostają
zerwane jeśli odległość ta jest zbyt wielka, lub jako taka zbyt długo się utrzymuje. Jednakże
precyzyjne określenie wartości D(k) (akceptowalnej przez obu graczy) w realnych negocjacjach
jest bardzo trudne i prawdopodobnie wartość ta winna być traktowana jako zmienna losowa.
W takich warunkach aktualne oferty graczy pozwalają jedynie na bardzo ogólne wnioskowanie
na temat ich prawdziwych punktów zgody i niosą znacznie mniej informacji na temat ich wzajemnej skłonności do ustępstw, niż to było w przypadku rozpatrywanego wyżej modelu. W
konsekwencji, istnieje znacznie mniejsza możliwość uzgodnienia wzajemnie spójnych oczekiwań
w trakcie trwania procesu negocjacji. Stąd dużo ważniejsze dla możliwości uzyskania porozumienia staje się rozpoczęcie negocjacji, w oparciu o oczekiwania, bazujące na stereotypowych
funkcjach użyteczności.
C.6
Ograniczona użyteczność przetargu (bargaining )
W świecie gdzie ludzie znali by nawzajem swoje funkcje użyteczności, nie byłoby praktycznie
potrzeby przeprowadzania negocjacji7 rozumianych w tradycyjny sposób, ponieważ gracze nie
musieli by wzajemnie testować funkcji użyteczności kontrpartnera poprzez kolejne sekwencji
ofert i kontrofert. Każdy z graczy mógłby po prostu ogłosić swoje ostateczne warunki w sposób
niezależny od drugiego i następnie porównać je z warunkami ogłoszonymi przez drugiego gracza.
Jeśli warunki te byłyby wzajemnie komplementarne, każdy z nich otrzymałby to, o co prosi.
Jeżeli nie byłyby komplementarne, zgoda nie byłaby zawarta (pod warunkiem, że oferty miały
charakter ultimatum). Jednakże w przypadku racjonalnych graczy można by łatwo zapewnić
możliwość uzyskania rozwiązania8 , ponieważ każdy z graczy mógłby je w sposób prosty wyliczyć,
a następnie przedstawić swoją ofertę w taki sposób, by żądać tylko takie wartości wypłaty dla
7
To stwierdzenie jest prawdziwe tak zarówno w klasycznym przetargu pozycyjnym [13], czy jak to bywa
inaczej nazywane, w przypadku negocjacji dystrybucyjnych [95], właściwych dla negocjacji dotyczących jednego
zagadnienia [96], jak też dla negocjacji integracyjnych, właściwych dla negocjacji dotyczących wielu kwestii [18].
8
Harsanyi zakłada tu, że jakiekolwiek rozwiązanie zawarte przy stole negocjacyjnym jest lepsze od braku
porozumienia.
C.6. OGRANICZONA UŻYTECZNOŚĆ PRZETARGU (BARGAINING)
99
siebie, jaka odpowiadałaby temu rozwiązaniu.
Nawet w sytuacji, gdy gracze nie znają nawzajem swoich funkcji użyteczności, jednak gdzie
blefowanie nie jest zabronione, negocjacje (przetarg pozycyjny) miałyby mały sens, ponieważ
gracze nie mogli by uzyskiwać użytecznych informacji na temat nieznanej funkcji użyteczności
kontrpartnera poprzez obserwację sposobu jego negocjowania – przy założeniu, że obaj grają
racjonalnie w tym sensie, że nie ujawniają rzeczywistych informacji, mogących osłabić ich pozycję
w grze.
Oczywiście w takiej sytuacji, negocjacje mogłyby funkcjonować nadal jako forma widowiska,
lub odgrywać rolę pewnej ceremonii. Oczywiście byłoby również miejsce dla negocjacji spełniających rolę inną, niż przetargowa (bargaining), jak np. przekazywanie faktycznych informacji
odnośnie możliwości kooperacji, czy strategicznych możliwości każdej ze stron dostępnych poza
stołem negocjacyjnym.
W rzeczywistym świecie istnieje jednakże miejsce dla negocjacji rozumianych w kategoriach przetargu z tego względu, że strony nie znają nawzajem swoich funkcji użyteczności oraz
ponieważ posiadają pewne motywacje do unikania blefowania. Tak więc obserwacja ofert kontrpartnera umożliwia zebranie pewnych informacji na temat jego funkcji użyteczności. Oczywiście
istnieje też możliwość, że kontrpartner popełni jakiś błąd taktyczny odsłaniając jakiś słaby punkt
w negocjacjach.
Jeśli założymy, że powyższe rozumowanie jest poprawne, tzn. że zakres użytecznych informacji, które gracze uzyskać mogą w trakcie negocjacji, jest istotnie ograniczony (i jeśli jest prawdą,
że doświadczeni negocjatorzy rzadko ujawniają informacje na temat ich słabych punktów), wówczas należy uznać, że przetarg jest praktyką znacznie mniej użyteczną niż się to powszechnie
wydaje na pierwszy rzut oka.
100
Zakończenie
W ramach zakończenia podsumowane zostaną podstawowe rezultaty pracy oraz nakreślone
kierunki dalszych badań. Rezultaty pracy są następujące:
• Dokonano analizy źródeł niepewności i ryzyka oraz związanych z nimi ograniczeń informacyjnych w konkurencyjnych i poddanych regulacji grach rynkowych.
• Zaproponowano sposób modelowego ujęcia ograniczeń informacyjnych w grach rynkowych.
• Dokonano analizy podejścia do gier z niepełną informacją zaproponowaną przez J.C.
Harsanyi i pokazano jego ograniczenia.
• Uzupełniono podejście Harsanyi o elementy analizy ograniczeń informacyjnych typowych
dla konkurencyjnych gier rynkowych.
Pożądanym kierunkiem dalszych studiów w zakresie informacyjnych aspektów konkurencyjnych gier rynkowych są zagadnienia związane z jednoczesnym występowaniem elementu konkurencji i kooperacji, co jest elementem charakterystycznym dla rynku telekomunikacyjnego.
101
102
DODATEK C. ZAKOŃCZENIE
Bibliografia
[1] Neil Abragimowicz. Modele symulacyjne i optymalizacyjne wspomagające ustalanie taryf
telekomunikacyjnych w połączeniach międzyoperatorskich. Praca dyplomowa, Politechnika
Warszawska Wydział Elektroniki i Technik Inforamacyjnych Instytut Automatyki i Informatyki Stosowanej, Warszawa, 1999.
[2] T. Basar, R. Srikant.
lowers.
A stackelberg network game with a large number of fol-
Journal of Optimization Theory and Applications, 115(3):479–490, 2002.
http://decision.csl.uiuc.edu/ tbasar/jota02-homepage.pdf.
[3] David Begg, Stanley Fischer, Rudiger Dornbusch. Mikroekonomia. Polskie Wydawnictwo
Ekonomiczne, Warszawa, 1999.
[4] Vera F. Birkenbihl.
Komunikacja Werbalna – psychologia prowadzenia negocjacji.
Wydawnictwo Astrum, Wrocław, 1997.
[5] Anna Blajer-Gołębiewska, Małgorzata Zielenkiewicz. Teoria gier jako narzędzie ekonomii
xx i xxi wieku. http://mikro.univ.szczecin.pl/bp/pdf/17/7.pdf.
[6] Christian Bongard, Dirk Moller, Achim Raimann, Nikodem Szadkowski, Urszula Dubejko.
Instrumenty ekonomiczne w prawie konkurencji. Urząd Ochrony Konkurencji i Kosnumentów, Bonn/Warszawa, 2007.
[7] Michael Carter, Julian Wright. Bargaining over interconnection: the clear-telecom dispute.
Working Paper 13, Centre for Research in Network Economics and Communications, University of Auckland, 2000.
[8] Robert Cialdini. Wywieranie wpływu na ludzi – teoria i praktyka. Gdańskie Wydawnictwo
Psychologiczne, Warszawa, 2004.
[9] Commission recommendation on relevant product and service markets within the electronic communications sector susceptible to ex ante regulation in accordance with Directive
2002/21/EC of the European Parliament and of the Council on a common regulatory
framework for electronic communication networks and services. Official Journal of the
European Union, 2003.
103
104
BIBLIOGRAFIA
[10] David Cray, Gregory E. Kersten. Negotiating inefficient compromises: Is less better than
more. Interim Report IR-99-022, IIASA, Laxenburg, Austria, 1999.
[11] Mira Montana Czarnowska. Podstawy negocjacji i komunikacji. Wyższa Szkoła Humanistyczna, Pułtusk, 2003.
[12] Roger Dawson. Sekrety udanych negocjacji. Wydawnictwo Santorski Wamex, Warszawa,
1997.
[13] Roger Dawson. Sekrety udanych negocjacji. Wydawnictwo Santorski Co, Warszawa, 2000.
[14] Decision theory and games.
www.actuarial.unsw.edu.au/courses/actl3003/
documents/LectureNotes/lecturenote10.pdf.
[15] Scott Denegre, Ted Raplhs. Multiobjective mixed-integer stackelberg games. Euro XXI,
Reykjavic, Iceland, 2006.
[16] Nicholas Economides, Giuseppe Lopomo, Glenn Woroch. Strategic commitments and the
principle of reciprocity in interconnection pricing. Discussion Paper EC-96-13, Stern School
of Business, New York University, 1996.
[17] R. Faure, J.P. Boss, A. Le Garf. Badania operacyjne. Państwowe Wydawnictwo Naukowe,
Warszawa, 1982.
[18] Roger Fisher, William Ury, Bruce Patton. Dochodząc do TAK - Negocjowanie bez poddawania się. Polskie Wydawnictwo Ekonomiczne, Warszawa, 2000.
[19] Krzysztof Fleszar. Zastosowanie analizy wielokryterialnej do wspomagania decyzji strategicznych. Praca magistarska, Politechnika Warszawska, Wydział Elektroniki i Technik
Informacyjnych, Instytut Automatyki i Informatyki Stosowanej, Warszawa, 2001.
[20] Kenji
tic
Fujiwara.
competition
A
with
stackelberg
sticky
price.
game
model
Economics
of
dynamic
Bulletin,
duopolis12(12):1–9.
http://economicsbulletin.vanderbilt.edu/2006/volume12/EB-06L10030A.pdf.
[21] Wojciech Gawęda. Spory w relacjach międzyoperatorskich – zasady ich rozstrzygania i
ingerencja regulatora. Liberalizacja dostępu telekomunikacyjnego, 3-4 października 2006.
Le Royal Meridien Bristol, Warszawa.
[22] Daniel Goleman. Inteligencja emocjonalna w praktyce. Media Rodzina, Poznań, 1999.
[23] Janusz Granat. Metody interakcji z użytkownikiem w wielokryterialnych systemach wspomagania decyzji. Rozprawa doktorska, Politechnika Warszawska, Wydział Elektroniki i
Technik Informacyjnych, Instytut Automatyki i Informatyki Stosowanej, Warszawa, 1997.
[24] Janusz Granat, Marek Makowski. Interactive specification and analysis of aspiration-based
preferences. European Journal of Operational Research, (122):469–485, 2000.
105
BIBLIOGRAFIA
[25] Janusz Granat, Andrzej P.Wierzbicki. Interactive specification of dss user preferences in
terms of fuzzy sets. Raport instytutowy WP-94-29, IIASA, Laxenburg, Austria, 1994.
[26] Janusz Granat, Andrzej P. Wierzbicki. Komputerowe narzędzia do wspomagania decyzji
w sektorze telekomunikacyjnym. Telekomunikacja i Techniki Informacyjne, 3-4, 2000.
[27] Janusz Granat, Andrzej P. Wierzbicki. Wybrane zastosowania technik wspomagania decyzji w sektorze telekomunikacyjnym. Krajowe Sympozjum Telekomunikacyjne, Bydgoszcz,
2000.
[28] John C. Harsanyi. Bargaining in ignorance of the opponent’s utility function. Journal
of Conflict Resolution, 6(1):29–38, 1962. http://cowles.econ.yale.edu/P/cp/p01b/
p0173.pdf.
[29] John C. Harsanyi.
Games with incomplete information – nobel lecture.
strony
136–152, 1994. http://nobelprize.org/nobel_prizes/economics/laureates/1994/
harsanyi-lecture.pdf.
[30] Benjamin E. Hermalin, Michael L. Katz. Network interconnection with two-sided user
benefits. Working paper, University of California, 2001.
[31] Tim Hindle. Skuteczne Negocjacje. Wydawnictwo Wiedza i Życie, Warszawa, 2000.
[32] Ganesh
tribution
Iyer,
J.
Miguel
channels.
Villas-Boas.
Journal
of
A
bargaining
Marketing
theory
Research,
of
dis-
XL:80–100.
http://groups.haas.berkeley.edu/marketing/PAPERS/IYER/bargaining.pdf.
[33] Alicja Jarugowa, Irena Sobańska, Renata Sochacka. Metody kalkulacji - koszty, ceny,
decyzje. Państwowe Wydawnictwo Ekonomiczne, Warszawa, 1991.
[34] Jacek Kamiński. Negocjacje jako proces etyczny. Biuletyn informacyjny Zespołu Etyki Biznesu 65, Towarzystwo Naukowe Prakseologii, Warszawa, 2002. www.cebi.win.pl/
texty/listopad02.doc.
[35] Jacek Kamiński. Negocjowanie – techniki rozwiązywania konfliktów. poltext, Warszawa,
2004.
[36] Gregory E. Kersten, Geoff R. Mallory. Rational inefficient compromises in negotiation.
Interim Report IR-98-024, IIASA, Laxenburg, Austria, 1998.
[37] Tomasz Kręglewski, Janusz Granat, Andrzej P. Wierzbicki. IAC-DIDAS-N, A Dynamic
Interactive Decision Analysis and Support System for Multicriteria Analysis of Nonlinear
Models, wolumen 4.0. IIASA, Laxenburg, Austria, 1991.
[38] Adam Krzemienowski. Średnia warunkowa jako narzędzie wspomagania decyzji w warunkach ryzyka. Rozprawa doktorska, Politechnika Warszawska, Wydział Elektroniki i Technik,
Warszawa, 2006.
106
BIBLIOGRAFIA
[39] ks. Marek Dziewiecki. Psychologia porozumiewania się. Jedność, Kielce, 2004.
[40] Michał Kuziak. Jak mówić, rozmawiać, przemawiać? Wydawnictwo Park, Bielsko-Biała,
2005.
[41] Sylwester Laskowski. Criteria of choosing strategy in games against nature. EUROCON
2007 - The International Conference on Computer as a Tool, strony 2323–2328, Warsaw.
IEEE press.
[42] Sylwester Laskowski. Opracowanie narzędzi analitycznych do wspomagania decyzji dotyczących wysokości opłat taryfikacyjnych i stawek rozliczeniowych na konkurencyjnym
rynku telekomunikacyjnym. Praca statutowa, Instytut Łączności, 20.
[43] Sylwester Laskowski. Game against nature: playing on competitive telecommunications
services market without knowledge of competitors’ costs. The Fourth International Conference on Decision Support for Telecommunications and Information Society, Warsaw,
2004. National Institute of Telecommunications.
[44] Sylwester Laskowski. Modelowanie gry rynkowej na konkurencyjnym rynku telekomunikacyjnym. Telekomunikacja i techniki Informacyjne, 3(4), 2004.
[45] Sylwester Laskowski. Niewystarczalność podejścia kosztowego w procesie ustalania cen za
usługi telekomunikacyjne. Ósma konferencja na temat: Międzynarodowe i polskie doświadczenia w zakresie połączeń międzyoperatorskich, Warszawa, 2004. Instytut Łączności.
[46] Sylwester Laskowski. O roli informacji na temat macierzy wypłat w konkurencyjnej grze
na rynku telekomunikacyjnym. Telekomunikacja i techniki Informacyjne, 3(4), 2004.
[47] Sylwester Laskowski. Wspomaganie procesu ustalania cen detalicznych i negocjacji stawek
rozliczeniowych na konkurencyjnym rynku usług telekomunikacyjnych. Rozprawa doktorska, Politechnika Warszawska, Wydział Elektroniki i Technik, Warszawa, 2004.
[48] Sylwester Laskowski. Criteria of choosing strategy in games against nature. The Fifth
International Conference on Decision Support for Telecommunications and Information
Society, Warsaw, 2005. National Institute of Telecommunications.
[49] Sylwester Laskowski. O kolejności ruchów w dwuosobowej grze na konkurencyjnym rynku
telekomunikacyjnym z asymetrią informacyjną. Telekomunikacja i techniki Informacyjne,
3(4), 2005.
[50] Sylwester Laskowski. Wspomaganie procesu ustalania cen detalicznych na konkurencyjnym rynku telekomunikacyjnym z asymetrią informacyjną. Telekomunikacja i techniki
Informacyjne, 1(2), 2005.
BIBLIOGRAFIA
107
[51] Sylwester Laskowski. Dobrze doinformowany konkurent. Zeszyty Naukowe Uniwersytetu
Szczecińskiego nr 463, Ekonomiczne Problemy Łączności nr 10, Przeobrażenia na rynku
łączności i kierunki jego rozwoju, 2007.
[52] Sylwester Laskowski. O metodzie wyboru strategii w konkurencyjnej grze podwójnej ze
znanym celem konkurenta – przypadki ahb i abh. Telekomunikacja i techniki Informacyjne,
(1-2), 2007.
[53] Sylwester Laskowski. Ustalona a preferowana kolejność ruchów w grze pojedynczej. Telekomunikacja i techniki Informacyjne, (3-4), 2007.
[54] Ming Li, Jr. Jose B. Crus, Marwan A. Simaan. An approach to discrete-time incentive
feedback stackelberg games. IEEE Transactions on Systems, Man, and Cyberneticts - Part
A: Systems and Humanas, 32(4), 2002. http://www.ece.osu.edu/ cruz/Papers/J99-SMC32-4.pdf.
[55] Grzegorz Lissowski. Teoria wyboru społecznego. Skrypt wykładu.
[56] Xavier Mancero, Eduardo Saavedra. Entry, cream skimming, and competition: Theory
and simulation for santiago de chile’s local telephony market. Raport instytutowy, Instituto Latinoamericano de Doctrina y Estudios Sociales, 2001. www.ilades.cl/economia/
publicaciones/ser_inv/inv132.pdf.
[57] Emmanuel Trelat Marc Jungers, Hisham Abou-Kandil. Stackelberg strategy with closedloop information structure for linear quadratic games. HAL - Hyper Articles en Ligne.
http://hal.archives-ouvertes.fr/docs/00/08/67/80/PDF/JTAKsiam.pdf.
[58] Paweł Markowski, Tomasz Olczyk. Negocjacje czyli rozmowa. Raport instytutowy, Fundacja Rozwoju Demokracji Lokalnej, 2003. www.frdl.org.pl/downloads/negoc4_vadem/
vade4_0301234.pdf.
[59] Jacek W. Mercik. Siła i oczekiwania, decyzje grupowe. PWN, Wrocław, 1999.
[60] Izabela Mileńko. Zagadnienia wspomagania indywidualnego planowania generacji wytwórców na rynku energii elektrycznej. Praca magisterska, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki i Informatyki Stosowanej,
Warszawa, 2000.
[61] John Morgan, Felix Vardy. An experimental study of commitment and observability in
stackelberg games. Games and Economic Behavior, 49(2):401–423.
[62] Roger B. Myerson. Harsanyi’s games with incomplete information. Management Science,
(50):1818–1824.
[63] Roger B. Myerson. Leartning game theory from john harsanyi. Raport instytutowy.
108
BIBLIOGRAFIA
[64] John F. Nash. The work of john nash in game theory. Raport instytutowy.
[65] Edward Nowak. Teoria kosztów w zarządzaniu przedsiębiorstwem. Wydawnictwo Naukowe
PWN, Warszawa, 1996.
[66] Włodzimierz Ogryczak. Wspomaganie decyzji w warunkach ryzyka. Skrypt wykładu,
Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki i Informatyki Stosowanej, Warszawa, 2002.
[67] Magdalena Olender-Skorek, Kornel Brunon Wydro. Wartość informacji. Telekomunikacja
i Techniki Informacyjne, 1-2:72–84, 2007.
[68] The International Society on Dynamical Games, redaktor. Inverse Stackelberg Games
and Their Application to Bilevel Optimal Toll Design Problem, 3-6th July 2006. http:
//www-sop.inria.fr/coprin/Congress/ISDG06/Abstract/stankova1.pdf.
[69] The International Society on Dynamical Games, redaktor. Inverse Stackelberg Games versus Adverse-Selection Principal-Agent Model Theory, 3-6th July 2006. http://www-sop.
inria.fr/coprin/Congress/ISDG06/Abstract/stankova2.pdf.
[70] Stanisław Piątek.
Prawo telekomunikacyjne Wspólnoty Europejskiej.
Wydawnictwo
C.H.Beck, Warszawa, 2003.
[71] Howard Raiffa. The art and since of negotiation. Harvard University Press, Cambridge
Massachusetts, 1982.
[72] B. Ricardo Raineri. Network competition: a general equilibrium analysis. Raport instytutowy, Encuentro de la Sociedad de Economia de Chile, 2003. www.econmeetings.cl/
pdf/sesion111raineri.pdf.
[73] Alvin E. Roth. Individual rationality and nash’s solution to the bargaining problem. Mathematics of Operatons Research, 2(1), 1977. http://kuznets.fas.harvard.edu/~aroth/
papers/1977_MOR_IndividualRationality.pdf.
[74] Bernard Roy. Wielokryterialne wspomaganie decyzji. Wydawnictwo Naukowo-Techniczne,
Warszawa, 1990.
[75] Robert A. Rządca. Negocjacje w interesach. Polskie Wydawnictwo Ekonomiczne, Warszawa, 2003.
[76] Robert A. Rządca, Paweł Wujec. Negocjacje. Polskie Wydawnictwo Ekonomiczne, Warszawa, 1998.
[77] Jeswald W. Salacuse. Write first, talk later? using drafts to make deals. Negotiation, (2).
A Newsletter Published by the Program on Negotiation at Harvard Law School.
109
BIBLIOGRAFIA
[78] Claude Elwood Shannon. A mathematical theory of communication. The Bell System
Technical Journal, 27:379–423, 623–656, July, October. Reprint.
[79] Marek Siudak. Badania Operacyjne. Oficyna Wydawnicza Politechniki Warszawskiej,
Warszawa, 1998.
[80] Vasiliki Skreta. Interconnection negotiations between telecommunication networks and
universal service objectives. Raport instytutowy, University of Minnesota, 2002. www.
econ.umn.edu/~screta/data/net.pdf.
[81] Andrzej Stachurski, Andrzej P. Wierzbicki. Podstawy optymalizacji. Oficyna Wydawnicza
Politechniki Warszawskiej, Warszawa, 1999.
[82] David Stiebel. Kiedy rozmowa pogarsza sprawę. Wydawnictwo Amber, 1997.
[83] Philip D. Straffin. Teoria gier. Wydawnictwo Naukowe Scholar, Warszawa, 2001.
[84] Lawrence E. Susskind, Robert H. Mnoookin, Boyd Fuller, Lukasz Rozdeiczer. Teaching
multiparty negotiation. Program on negotiation at Harvard Law School, 2003. Conference
Summary.
[85] Eugeniusz Toczyłowski. Optymalizacja w badaniach operacyjnych. Skrypt wykładu, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki i Informatyki Stosowanej, Warszawa, 1996.
[86] Eugeniusz Toczyłowski. Optymalizacja procesów rynkowych przy ograniczeniach. Akademicka Oficyna Wydawnicza EXIT, Warszawa, 2002.
[87] Wiesław Traczyk, i in. Problemy Sztucznej Inteligencji. Wiedza i Życie, Warszawa, 1995.
[88] Jerzy Trzaskowski. Negocjacje międzyoperatorskie - standardy współpracy skazanej na
kompromis oparty na obustronnych korzyściach.
Liberalizacja dostępu telekomunika-
cyjnego, 3-4 października 2006. Le Royal Meridien Bristol, Warszawa.
[89] Jan Turyna, Beata Pułaska-Turyna. Rachunek kosztów i wyników. Finans Servis, Warszawa, 1996.
[90] Tadeusz Tyszka. Konflikty i strategie – niektóre zastosowania teorii gier. Wydawnictwo
Naukowo-Techniczne, Warszawa, 1978.
[91] Leibniz Universitat, redaktor. Stackelberg games – properties and applications, 24th April.
[92] William Ury. Odchodząc od NIE - negocjowanie od konfrontacji do kooperacji. Polskie
Wydawnictwo Ekonomiczne, Warszawa, 2000.
[93] William Ury. Dochodząc do zgody. Biblioteka Moderatora, Taszów, 2006.
[94] Stan van Hoesel. An overview of stackelberg pricing in networks. Research Memoranda
042, Maastricht : METEOR, 2006. http://arno.unimaas.nl/show.cgi?fid=3724.
110
BIBLIOGRAFIA
[95] Michael Watkins. Sztuka negocjacji w biznesie - innowacyjne podejścia prowadzące do
przełomu. Helion, Gliwice, 2005.
[96] Andrzej P. Wierzbicki. Sztuka i techniki negocjacji. Skrypt wykładu, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki i Informatyki
Stosowanej, Warszawa, 1996.
[97] Andrzej P. Wierzbicki. Reference point methods in vector optimization and decision support. Interim Report IR-98-017, International Institute for Applied Systems Analysis,
Laxenburg, Austria, 1998.
[98] Andrzej P. Wierzbicki. Optymalizacja i wspomaganie decyzji. Skrypt wykładu, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki i
Informatyki Stosowanej, Warszawa, 2000.
[99] Andrzej P. Wierzbicki, Janusz Granat. Multi-objective modeling for engineering applications: Didasn++ system. European Journal of Operational Research, (113):374–389,
1999.
[100] Andrzej P. Wierzbicki, Marek Makowski. Multi-objective optimization in negotiation support. Raport instytutowy, International Institute for Applied Systems Analysis, Laxenburg, Austria, 1992.
[101] Andrzej P. Wierzbicki, Kornel B. Wydro. Informacyjne Aspekty Negocjacji. Wydawnictwo
Naukowe Obserwacje, Warszawa, 2006.
[102] Nikołaj. N. Worobiew, Edward Kofler, Henryk Greniewski. Strategia gier. Książka i
Wiedza, Warszawa, 1969.
[103] Glenn A. Woroch. Local network competition. Handbook of Telecommunications Economics, rozdzia/l 15. Cave and Majumdar and Vogelsang, 2002. http://emlab.berkeley.
edu./users/woroch/.
[104] www.wikipedia.org.
Strategia
konkurencji.
http://pl.wikipedia.org/wiki/
Strategia_konkurencji.
[105] Anna Zarębska. Poradnik dla eksporterów, rozdzia/l Techniki prowadzenia negocjacji w
kontekście handlu międzynarodowego. Lubelska Fundacja Rozwoju - Euro Info Centre
PL416. www.ifr.lublin.pl/poradnik_dla_eksporterow.pdf.

Informacyjne aspekty gier konkurencyjnych na konkurencyjnym

Transkrypt

Podobne dokumenty

zasady gry

„Daję głowę” jest lekką i pełną humoru grą towarzyską rozgrywaną

need for speed carbon (ps2)