Informacyjne aspekty gier konkurencyjnych na konkurencyjnym
Transkrypt
Informacyjne aspekty gier konkurencyjnych na konkurencyjnym
Instytut Łączności Praca statutowa nr 11.30.002.7 Informacyjne aspekty gier konkurencyjnych na konkurencyjnym rynku usług telekomunikacyjnych dr inż. Sylwester Laskowski Konsultacje: prof. dr hab. inż. Andrzej P. Wierzbicki Warszawa, grudzień 2007. ii Spis treści Wprowadzenie I ix Część główna pracy 1 1 Niepewność i ryzyko w grach rynkowych 3 1.1 Niepewność, ryzyko, przewidywalność i informacja . . . . . . . . . . . . . . . . . 3 1.2 Informacja a system rynkowy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2.1 Niepewność w systemie rynkowym . . . . . . . . . . . . . . . . . . . . . . 5 1.2.2 Nieefektywność rynku wynikła z ograniczeń informacyjnych . . . . . . . . 6 1.2.3 Informacja o rynku a rynek informacji . . . . . . . . . . . . . . . . . . . . 10 1.3 Źródła niepewności i ryzyka w rzeczywistych grach rynkowych . . . . . . . . . . . 10 1.4 Podsumowanie i wnioski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 2 Model konkurencyjnej gry rynkowej 15 2.1 Podstawowe pojęcia teorii gier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 2.2 Modele gry rynkowej na konkurencyjnym rynku telekomunikacyjnym . . . . . . . 17 2.2.1 Identyfikacja rynków . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.2.2 Identyfikacja graczy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.2.3 Identyfikacja strategii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2.2.4 Identyfikacja funkcji wypłaty . . . . . . . . . . . . . . . . . . . . . . . . . 21 Rodzaje gier na rynku telekomunikacyjnym i ich własności . . . . . . . . . . . . . 24 2.3 3 Modelowe ujęcie ograniczeń informacyjnych w grze rynkowej 27 3.1 Informacyjna reprezentacja graczy w grze . . . . . . . . . . . . . . . . . . . . . . 27 3.2 Klasyfikacja gier ze względu na informacyjną reprezentację graczy 29 iii . . . . . . . . 4 Gry z niepełną informacją w ujęciu J. C. Harsanyi 4.1 4.2 Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 4.1.1 Teoria gier i klasyczna ekonomia . . . . . . . . . . . . . . . . . . . . . . . 33 4.1.2 Problem niekompletnej informacji . . . . . . . . . . . . . . . . . . . . . . 34 Dwu-osobowa I-gra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 4.2.1 Model bazujący na przypuszczeniach coraz wyższego rzędu . . . . . . . . 35 4.2.2 Negocjacje pomiędzy Stanami Zjednoczonymi a Związkiem Radzieckim, odnośnie kontroli zbrojeń . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 4.2.3 Interpretacja I-gier skupiona na typach graczy . . . . . . . . . . . . . . . 37 4.2.4 Dwa aktywne typy i ich funkcje wypłaty . . . . . . . . . . . . . . . . . . . 38 4.2.5 Zakres posiadanej wiedzy w grze . . . . . . . . . . . . . . . . . . . . . . . 38 4.2.6 Dwa istotne rozróżnienia . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 4.2.7 Model probabilistyczny I-gry G . . . . . . . . . . . . . . . . . . . . . . . . 40 4.2.8 Przekształcenie I-gry G z niepełną (incomplete) informacją w grę G∗ z 4.2.9 pełną (complete) ale niedoskonałą (imperfect) informacją . . . . . . . . . 41 Warunkowe prawdopodobieństwa w grze G∗ . . . . . . . . . . . . . . . . . 42 4.2.10 Semi-warunkowa funkcja wypłaty dwu aktywnych typów w grze 4.3 33 . . . . . 42 N-osobowa I-gra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.3.1 Typy różnych graczy, aktywny zbiór, i właściwe zbiory w n-osobowej I-grze 44 4.3.2 Niektóre prawdopodobieństwa . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.3.3 Profile strategii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 4.3.4 Warunkowe funkcje wypłaty . . . . . . . . . . . . . . . . . . . . . . . . . . 47 4.3.5 Semi-warunowe funkcje wypłaty . . . . . . . . . . . . . . . . . . . . . . . 48 5 Gry z niepełną informacją – uzupełnienie podejścia J. C. Harsanyi 49 5.1 Wprowadzenie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 5.2 Dany gracz nie zna swojego typu . . . . . . . . . . . . . . . . . . . . . . . . . . . 50 5.2.1 Streszczenie podejścia Harsanyi . . . . . . . . . . . . . . . . . . . . . . . . 50 5.2.2 Dany gracz nie zna swojego typu i zna typ innych graczy . . . . . . . . . 53 5.2.3 Dany gracz nie zna swojego typu i nie zna typu innych graczy . . . . . . 55 5.2.4 Przypadki niesymetrycznej informacji . . . . . . . . . . . . . . . . . . . . 57 5.3 Dany gracz wykonuje ruch jako pierwszy . . . . . . . . . . . . . . . . . . . . . . . 57 5.4 Nieznana kolejność ruchów graczy . . . . . . . . . . . . . . . . . . . . . . . . . . 59 5.5 Wartość informacji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 iv II Dodatki i Zakończenie 61 A Preferowana kolejność ruchów a równowaga Nasha i model gry Stackelberga 63 A.1 Preferowana kolejność ruchów w grze pojedynczej . . . . . . . . . . . . . . . . . . 65 A.2 Preferowana kolejność ruchów a równowaga Nasha . . . . . . . . . . . . . . . . . 71 A.3 Preferowana kolejność ruchów a model gry Stackelberga . . . . . . . . . . . . . . 74 A.4 Wnioski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 B Narzędzia wspomagania decyzji w warunkach niepewności i ryzyka 79 B.1 Narzędzia wspomagania decyzji w warunkach niepewności - kryteria wyboru strategii w grze przeciwko naturze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 B.1.1 Kryterium Walda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 B.1.2 Kryterium optymistyczne . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 B.1.3 Kryterium Hurwicza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 B.1.4 Kryterium Laplace’a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 B.1.5 Kryterium Savage’a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 B.1.6 Kryterium maksymalizacji liczby największych wygranych (LNW) . . . . 83 B.1.7 Kryterium maksymalizacji liczby największych wygranych z progiem uznania (LNWP) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 B.1.8 Kryterium maksymalizacji sumy największych wypłat z progiem uznania (SNWP) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 B.1.9 Kryterium maksymalizacji wartości oczekiwanej wypłaty z progiem uznania (EWP) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 B.1.10 Kryterium minimalizacji wartości oczekiwanej straty z progiem uznania (ESP) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 B.1.11 Kryterium maksymalizacji progowej wartości oczekiwanej wypłaty (PEW) 86 B.1.12 Kryterium minimalizacji progowej wartości oczekiwanej straty (PES) . . . 86 B.2 Narzędzia wspomagania decyzji w warunkach ryzyka . . . . . . . . . . . . . . . . 87 C John’a C. Harsanyi: Dwustronne negocjacje w sytuacji nieznajomości funkcji użyteczności kontrpartnera w grze. 89 C.1 Próba ustalenia wartości punktu zgody . . . . . . . . . . . . . . . . . . . . . . . . 89 C.2 Arbitrażowe rozwiązanie Zuethen’a-Nash’a w przypadku znajomości funkcji użyteczności . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 C.3 Estymacja arbitrażowego rozwiązania Zeuthen’a-Nash’a w przypadku nieznajomości funkcji użyteczności . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . v 92 C.4 Problem zbieżności i wzajemnej kompatybilności sekwencji Ai (n) . . . . . . . . . 94 C.5 Model gry ułatwiający doprowadzenie do komplementarności punktów zgody, w przypadku dopuszczenia blefowania . . . . . . . . . . . . . . . . . . . . . . . . . . C.6 Ograniczona użyteczność przetargu (bargaining) . . . . . . . . . . . . . . . . . . 97 98 Zakończenie 101 Bibliografia 110 vi Spis tabel 2.1 Ilustracja pojęć strategia i wypłata. . . . . . . . . . . . . . . . . . . . . . . . . . A.1 Przykładowa macierz wypłat w grze podwójnej. 17 . . . . . . . . . . . . . . . . . . 64 A.2 Macierz wypłat w grze pojedynczej. . . . . . . . . . . . . . . . . . . . . . . . . . 65 A.3 Macierz wypłat w grze pojedynczej z preferencją pierwszego. . . . . . . . . . . . 65 A.4 Macierz wypłat w grze pojedynczej z preferencją drugiego. . . . . . . . . . . . . . 66 A.5 Macierz wypłat w grze pojedynczej z jednostronną preferencją drugiego. . . . . . 68 A.6 Macierz wypłat w grze, w której mimo identyczności wypłat gracza B dla strategii b1 i b2 nie są one niejednoznaczne. . . . . . . . . . . . . . . . . . . . . . . . . . . 70 A.7 Macierz wypłat w grze, w której mimo różnych wartości wypłat dla strategii gracza B, strategie te są niejednoznaczne wówczas, gdy gracz B wykonuje ruch jako pierwszy. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 A.8 Macierz wypłat w grze bez preferencji ruchów. . . . . . . . . . . . . . . . . . . . 71 A.9 Macierz wypłat w grze z preferencją pierwszego, w której jest tylko jedno rozwiązanie równowagowe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 A.10 Macierz wypłat w grze z preferencją pierwszego, w której nie ma rozwiązania równowagowego. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 A.11 Macierz wypłat w grze pojedynczej z preferencją drugiego, w której istnieje rozwiązanie równowagowe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 A.12 Ilustracja przypadku, gdy graczowi A opłaca się ruszyć jako pierwszy, gdy gracz B zna jego macierz wypłat i jako drugi, gdy gracz B nie zna jego macierzy wypłat. 77 vii viii Wprowadzenie Jeśli nawet ostatecznie nie o nią samą chodzi1 – informacja jest dobrem istotnym i podstawowym w działalności człowieka. Wraz ze zmianami cywilizacyjnymi i społecznymi, jakie w głównej mierze zapoczątkowane zostały rozwojem i upowszechnieniem technologii komunikacji elektronicznej, informacja staje się coraz bardziej równoprawnym – względem kapitału i pracy – determinantem sukcesu w działalności gospodarczej. Informacja stała się na globalną skalę dobrem o wartości nie tylko poznawczej, ale również i komercyjnej. Hasło „wiedzieć więcej” coraz łatwiej jest przekształcić w realność stwierdzenia „odnieść większy sukces”. „Większy” jest pojęciem względnym. Zdaje się, że – niestety – coraz rzadziej owa względność zamyka się w ramach stwierdzenia rozwoju, poprawy wyników na przestrzeni historii działalności określonego podmiotu. Wymiar czasowy zdaje się odgrywać coraz mniejszą rolę w znaczeniu pojęcia „większy”. Dominującym znaczeniem staje się wymiar przestrzenny. Innymi słowy nie wystarcza już odnieść sukces większy niż w przeszłości, teraz trzeba odnieść sukces większy niż inni! Pojęcie „przewagi konkurencyjnej” staje się niemalże dogmatyczną zasadą działalności rynkowej. Nie pozostaje to bez wpływu na podejście do informacji. Zasada osiągania „przewagi konkurencyjnej” wyznacza jednoznaczny kierunek: „wiedzieć więcej niż inni”. Znamienna dla działalności gospodarczej rywalizacja o dostęp do ograniczonych zasobów spotyka się więc z na pozór paradoksalną sytuacją czerpania korzyści z faktu ograniczonego dla innych dostępu do informacji. Okazuje się jednak, iż w niektórych przypadkach takie podejście zawodzi. Choć niejednokrotnie zasada „wiedzieć więcej niż inni” istotnie rodzi możliwość odniesienia większego sukcesu, to istnieją również przypadki, w których niewiedza innych bywa niekorzystna dla tego, kto wie [46, 51]. Istotnym jest stwierdzenie, że dla danego decydenta, uczestnika gry rynkowej (gracza) zawsze jest lepiej posiadać większą niż mniejszą wiedzę – lepiej jest wiedzieć, niż nie wiedzieć. Wiedza o danej sytuacji decyzyjnej często przekłada się na możliwość lepszego ocenienia skutków podjęcia 1 „Where is the wisdom we have lost in knowledge? Where is the knowledge we have lost in information?” T.S. Eliot. ix określonych działań czy decyzji, w ten sposób ułatwiając wyłonienie działania lub decyzji najlepszych. Wiedza ta jednakże nie wyklucza możliwości wyboru opcji, którą zamierzało się wybrać w sytuacji niewiedzy. Dlatego też z obiektywnego punktu widzenia, zawsze jest lepiej wiedzieć niż nie wiedzieć. Rzecz jasna subiektywne uwarunkowania danego decydenta mogą sprawić, iż określona wiedza (w szczególności dotycząca możliwości wystąpienia szczególnie niekorzystnych sytuacji) może niekorzystnie wpłynąć na racjonalność myślenia decydenta i w ten sposób przyczynić się do wybrania opcji gorszej, niźli w przypadku niewiedzy. Możliwą jest również sytuacja, w której wiedza, w szczególności wiedza o charakterze probabilistycznym zachęca decydenta do podjęcia pewnego ryzyka w swojej decyzji, co przynieść może rozwiązanie gorsze od wyniku dostępnego w sytuacji niewiedzy. Obiektywnie jednak punkt wyjścia i w tym przypadku (znajomość rozkładu prawdopodobieństwa różnych zdarzeń) jest lepszy, niż w przypadku braku tego typu informacji: opcja dostępna w sytuacji niewiedzy w dalszym ciągu pozostaje dostępną. Niniejsza praca poświącona jest analizie wybranych aspektów związanych z kwestią informacji i jej braku w konkurencyjnych grach rynkowych. Bezpośrednią inspiracją podjęcia tematu jest problematyka konkurencji na rynku telekomunikacyjnym. Podejmowane zagadnienia odnoszą się jednak równie dobrze do wielu innych sytuacji i to nie tylko o charakterze gier rynkowych. x Część I Część główna pracy 1 Rozdział 1 Niepewność i ryzyko w grach rynkowych 1.1 Niepewność, ryzyko, przewidywalność i informacja Niepewność jest pojęciem odnoszącym się do zjawisk przyszłych. To co, było dotychczas i to co dzieje się w chwili obecnej jest zawsze pewne. Niepewną może być jedynie przyszłość. Niepewność rodzi się z braku pewnych, czyli wiarygodnych informacji odnośnie tego, co wydarzy się w przyszłości: za chwilę, jutro, za miesiąc, za rok itd. Postawić zatem można znak równości pomiędzy pojęciem niepewności a nieznajomością przyszłości. Każda decyzja podejmowana w chwili obecnej posiada pewne skutki w przyszłości. A zatem o tyle, o ile niepewną jest przyszłość, o tyle niepewnymi są i owe skutki, a zatem o tyle też sam proces decyzyjny nabiera znamion decyzji w warunkach niepewności. Ponieważ przyszłość jest zawsze w jakiejś mierze niepewna, to i praktycznie każdy proces podejmowania decyzji określić można jako proces podejmowania decyzji w warunkach niepewności. A zatem proces podejmowania decyzji w warunkach niepewności jest najbardziej ogólną kategorią procesów decyzyjnych. Wszystkie inne stanowią jego przypadek szczególny. Chaos i przypadkowość nie stanowią nadrzędnych zasad rządzących światem. Świat (tak w jego mikro, jak i makro ujęciu) jest zawsze w jakiejś mierze przewidywalny, poddany pewnym zasadom, mechanizmom, regułom, które czynią pewne zjawiska i pewne skutki tych zjawisk bardziej prawdopodobnymi od innych. Świat, a w tym i istniejące w nim procesy decyzyjne jest więc nie tyle światem niepewności co światem ryzyka (jeśli posłużyć się klasycznym rozróżnieniem przyjętym w teorii decyzji przyjmującej, że o ryzyku mowa jest tam, gdzie znane są prawdopodobieństwa występowania określonych zjawisk [66]). Odróżnić jednakże trzeba tu dwie kwestie: obiektywność zasad rządzących światem i subiek3 4 ROZDZIAŁ 1. NIEPEWNOŚĆ I RYZYKO W GRACH RYNKOWYCH tywną świadomość danego podmiotu odnośnie istnienia tych zasad. I tak zasady czynią świat i istniejące w nim zjawiska i procesy bardziej przewidywalnymi w sensie obiektywnym, jednakże dla danego podmiotu, próbującego przewidywać przyszłość (stan świata w chwili przyszłej) celność tego przewidywania zależna jest od stopnia znajomości tychże zasad. Obiektywnie więc świat będzie zawsze światem ryzyka, subiektywnie jednak pozostawać może światem niepewności. Kluczowego znaczenia nabiera tu element informacji, czy wiedzy (jeśli rozumieć ją jako informację poddaną procesom selekcji, weryfikacji i strukturyzacji), a nawet mądrości (jeśli rozumieć ją jako umiejętność dokonywania trafnych wyborów pomiędzy przedmiotami na pozór nierozróżnialnymi). Wiedza o tym, co wydarzy się (czy raczej wydarzyć się może) w przyszłości zależna jest od wiedzy odnośnie stanu chwili obecnej jak również zasady, która tę chwilę przetransformuje w przyszłość. Użyte wyżej pojęcie zasady ma tu znaczenie bardzo szerokie. W szczególności może to być zasada ściśle deterministyczna (jak np. zasada grawitacji), jak również zasada o charakterze probabilistycznym (jak np. wewnętrzna zasada podejmowania decyzji przez człowieka obdarzonego wolną wolą1 ). Zakres niewiedzy (jak i z konieczności – z racji na idealnie symetryczne przeciwieństwo – zakres wiedzy) może być teoretycznie rzecz biorąc nieograniczony. Teoretycznie rzecz ujmując wydarzyć może się niemalże wszystko (przyszłość może przyjmować nieskończoną liczbę stanów, np. moneta podrzucona do góry może upaść wskazując na orła lub reszką, może stanąć na krawędzi, może w ogóle nie upaść, może rozsypać się na dwie części, może rozsypać się na trzy części, może zniknąć, może zamienić się w ptaka lub krople deszczu2 ... itd.). Doświadczenie czerpane z historii pozwala nam jednak z dość dużym prawdopodobieństwem zakładać, że w praktyce przyszłość przyjmie jeden ze stanów należących do mimo wszystko ograniczonego zbioru (orzeł lub reszka). W teorii decyzji w warunkach niepewności przyjęło się czynić takie minimalne (a mimo to silne) założenie, że liczba stanów w przyszłości (co bywa określane jako liczba stanów natury [83]) jest ustalona, ograniczona (a często nawet skończona) i co więcej znana decydentowi. Nieznana jest jednakże zasada (ani w sensie deterministycznym, ani w sensie probabilistycznym) przekształcająca chwilę obecną w jeden ze stanów przyszłości. Zwykle zakłada się też, że znany jest wpływ określonego stanu w przyszłości na skutek decyzji podjętej w chwili obecnej. W praktyce oznacza to również, że znana jest zasada transformująca podjętą decyzję w ów skutek (przy 1 Oczywiście założenie o probabilistycznym charakterze decyzji podejmowanych przez ludzi jest tu jedynie jednym z możliwych ujęć o charakterze modelowym. Przy takim podejściu przyjąć można, że decyzje zgodne z wewnętrznym systemem wartości człowieka są bardziej prawdopodobne od decyzji z tym systemem sprzecznych. 2 Bez wątpienia znajdą się tacy, co i tę sytuację uznają za przynajmniej teoretycznie możliwą. 1.2. INFORMACJA A SYSTEM RYNKOWY 5 założeniu znanego stanu przyszłości). Co więcej, zakłada sie ponadto, iż decydent podejmujący decyzje jest w stanie właściwie ocenić subiektywną (czyli z jego punktu widzenia) wartość określonego skutku, co więcej porównać ją z wartością innych skutków i w ten sposób stworzyć spójną ich hierarchię. Mówi się więc o znajomości tzw. funkcji wartości czy funkcji użyteczności – różnorako definiowanej [66, 98] – decydenta. I na koniec zakłada się, że decydent dobrze wie, jakie decyzje ma do dyspozycji. Z powyższego widać jasno, że teoria wspomagania decyzji w warunkach niepewności w punkcie wyjścia zakłada posiadanie dość bogatego zakresu informacji (czyli ograniczenia istniejącej niepewności), która jest niezbędna do tego, by dokonać jakiejkolwiek analizy sytuacji decyzyjnej. Teoria wspomagania decyzji w warunkach ryzyka idzie o krok dalej, zakładając, że znane są prawdopodobieństwa wystąpienia poszczególnych stanów w przyszłości (w przypadku decyzji w warunkach niepewności przyjmuje się, że prawdopodobieństwa te są nie znane, co z punktu widzenia analizy wymusza założenie jednakowości tych prawdopodobieństw3 ). 1.2 Informacja a system rynkowy 1.2.1 Niepewność w systemie rynkowym Zgodnie z wcześniejszymi ustaleniami, dla pełnego wyeliminowania niepewności z procesów decyzyjnych, czyli precyzyjnego przewidzenia przyszłego skutku podjętej decyzji, koniecznym jest posiadanie pełnej informacji na temat: • Aktualnego stanu otoczenia tworzącego kontekst i warunki początkowe towarzyszące podejmowanej decyzji; • Charakteru zasady przekształcającej podjętą decyzję w skutek. 3 Zaobserwować tu można swoisty paradoks zachodzący pomiędzy oboma teoriami. Jak to wcześniej wspom- inano teoria podejmowania decyzji w warunkach niepewności jest najbardziej ogólną teorią w tym sensie, że nie wymaga posiadania informacji na temat prawdopodobieństwa występowania poszczególnych stanów przyszłości. W tym sensie teoria podejmowania decyzji w warunkach ryzyka jest przypadkiem szczególnym teorii podejmowania decyzji w warunkach niepewności (otrzymuję się ją z tej drugiej poprzez dołożenie założenia znajomości prawdopodobieństw występowania poszczególnych stanów przyszłości – poprzez ustalenie wartości określonych zmiennych, tj. prawdopodobieństw). Jednakże z drugiej strony powiedzieć można, że to teoria podejmowania decyzji w warunkach niepewności jest szczególnym przypadkiem teorii podejmowania decyzji w warunkach ryzyka, a to z tego względu, że pierwszą otrzymuje się z drugiej poprzez założenie jednakowych wartości prawdopodobieństw występowania stanów przyszłości (które zgodnie z teorią podejmowania decyzji w warunkach ryzyka są ustalone i znane). 6 ROZDZIAŁ 1. NIEPEWNOŚĆ I RYZYKO W GRACH RYNKOWYCH Przy czym jeśli wyżej wspomniany stan otoczenia i/lub zasada będą miały charakter probabilistyczny, to skutek będzie mógł być przewidziany jedynie w sposób probabilistyczny (proces decyzyjny będzie procesem w warunkach ryzyka). Jeśli zaś stan otoczenia określony będzie w sposób jednoznaczny i zasada będzie miała charakter deterministyczny, to skutek podjęcia określonej decyzji będzie możliwy do przewidzenia w sposób jednoznaczny. W przypadku systemów rynkowych o informacji lub jej braku (ograniczeniu) mówić możemy w dwóch perspektywach: podmiotowej i przedmiotowej. W perspektywie podmiotowej pytamy o to, kto posiada lub nie posiada określonej informacji. W perspektywie przedmiotowej pytamy o to co ów ktoś wie lub czego nie wie. Obie perspektywy określają wspólnie, choć oczywiście nie w sposób wyczerpujący to, co wyżej nazwaliśmy stanem otoczenia i zasadą. Każdy z podmiotów funkcjonujących na określonym rynku odgrywa określoną rolę na tym rynku (jest konsumentem, dostawcą usług, regulatorem itp.) Od informacji jaką posiada zależy do, w jaki sposób odgrywał będzie tę rolę (jakie decyzje będzie podejmował), wpływając tym samym na stan otoczenia w jakim funkcjonuję (podejmują swoje decyzje) inne podmioty. Jednocześnie zaś jego decyzje kształtują sam mechanizm rynkowy, czyli ową zasadę przekształcającą decyzje innych podmiotów w konkretne skutki. Innymi słowy decyzje danego podmiotu (wynikłe z zakresu posiadanej przez niego informacji) określają stan otoczenia i zasadę dla innych podmiotów. Decyzje tych ostatnich zaś (wynikłe z informacji posiadanej przez nich) określają stan otoczenia i zasadę dla tegoż podmiotu. Widać zatem, że dla usunięcia elementu niepewności z systemu rynkowego koniecznym byłaby nie tylko wiedza na temat tego, kto na danym rynku funkcjonuje i to nawet w najszerszym rozumieniu owego pojęcia, uwzględniającym pełną charakterystykę owych podmiotów (w tym ich cele, wartości, sposoby postępowania itp.). Drugim koniecznym elementem byłaby wiedza na temat tego co owe podmioty wiedzą na temat siebie nawzajem, w tym również co wiedzą na temat tego co wiedzą inni. Widać zatem, iż ograniczenia informacyjne jakim podlegają poszczególne podmioty funkcjonujące w ramach określonego systemu rynkowego, w sposób nieunikniony determinują niepewność jego funkcjonowania, a więc i niepewność skutków decyzji podejmowanych przez poszczególne podmioty. W szczególności zaś niepewnym jest to, czy cały system działał będzie w sposób efektywny. 1.2.2 Nieefektywność rynku wynikła z ograniczeń informacyjnych Funkcjonujące w modelu konkurencji doskonałej założenie posiadania przez pomioty pełnej informacji odnośnie wszelkich faktów związanych z danym system rynkowym [3] w praktyce nigdy nie jest spełnione. Rodzi to zagrożenie nieefektywnego funkcjonowania tegoż systemu. Ta nieefek- 1.2. INFORMACJA A SYSTEM RYNKOWY 7 tywność, swoista zawodność mechanizmu rynkowego, a uprzednio niedoinformowanie ujawniać się może na trzech poziomach: • Poziom relacji handlowych; • Poziom konkurencji; • Poziom regulacji. Ograniczenia informacyjne na poziomie relacji handlowych Na poziomie relacji handlowych, relacji kupno-sprzedaż ograniczenia informacyjne prowadzić mogą do: • Niezawarcia transakcji korzystnej dla obu stron; • Zawierania niekorzystnych (co najmniej dla jednej ze stron) transakcji; • Niedotrzymania warunków zawartej transakcji. Każdy z tych trzech przypadków rozpatrywać można jako czynnik zwiększający zawodność mechanizmu rynkowego w procesie efektywnej alokacji zasobów. Każdy z nich wynika też z braku informacji nieco innego typu. Są to odpowiednio: • Brak należytej informacji na temat cech oferowanego produktu i korzyści związanych z ich nabyciem; • Brak należytej informacji na temat dostępności alternatywnych sprzedawców lub nabywców; • Brak należytej informacji na temat wiarygodności partnera w relacji handlowej. Brak należytej informacji na temat cech oferowanego produktu i korzyści związanych z ich nabyciem prowadzi do tego, że korzystna dla każdej ze stron transakcja może nie zostać zawarta. Z pozoru problem wydaje się łatwy do pokonania, bowiem w interesie sprzedawcy jest przekazanie stosownych informacji na temat oferowanego produktu. Jednakże w niektórych przypadkach jest to o tyle trudne, że korzyści z nabycia określonego dobra ujawniają się dopiero po upływie długiego czasu, a przy tym uzależnione są od przypadków losowych. Taka sytuacja zachodzi dla przykładu w kontekście finansowania rozwoju służby zdrowia. Co więcej informacja o oferowanym produkcie może stanowić istotną część samego produktu (jak to jest np. w przypadku sprzedaży dostępu do treści artykułów naukowych), a więc z definicji nie może być 8 ROZDZIAŁ 1. NIEPEWNOŚĆ I RYZYKO W GRACH RYNKOWYCH udostępniona przed jej nabyciem. I wreszcie wiąże się z tym kwestia zaufania nabywcy względem sprzedawcy, że przekazywane informacje są wiarygodne. Charakterystycznym efektem związanym z brakiem należytej informacji na temat cech oferowanego produktu i korzyści związanych z ich nabyciem jest tzw. selekcja negatywna (adverse selection), która prowadzi do załamania rynku dóbr wysokiej jakości. Wynika to z faktu, że nabywcy, znając jedynie przeciętną jakość oferowanych dóbr, nie są gotowi do zapłacenia wyższej ceny za domniemane dobro wysokiej jakości. W następstwie zanikają zachęty do oferowania dóbr wyższej jakości, dominująca na rynku przeciętna jakość stale się obniża, a co za tym idzie, spada także gotowość do zapłaty [6]. Brak należytej informacji na temat dostępności alternatywnych sprzedawców lub nabywców prowadzi często do zawarcia transakcji niekorzystnej dla jednej ze stron. Dzieje się tak zawsze wówczas gdy istnieją alternatywni sprzedawcy oferujący substytucyjny produkt lepszej jakości i/lub po niższej cenie, lub też gdy istnieją alternatywni nabywcy gotowi zapłacić więcej za oferowane im dobro. Trudność z przełamaniem tej bariery polega na tym, że w ramach nawiązywanej relacji handlowej w interesie stron nie jest przekazywanie partnerom tego typu informacji. Każda ze stron musi zabiegać o jej pozyskanie inną drogą. Brak należytej informacji na temat wiarygodności partnera w relacji handlowej może doprowadzić tak zarówno do nie zawarcia korzystnej dla obu stron transakcji (niedostateczny poziom zaufania)4 , jak też do zawarcia transakcji niekorzystnej, lub niedotrzymania pierwotnie ustalonych warunków współpracy (nadmierny poziom zaufania), w szczególności zaś wymuszenia ich zmiany na jednostronnie korzystne5 . Ograniczenia informacyjne na poziomie konkurencji Ograniczenia informacyjne na poziomie konkurencji, na poziomie wzajemnej zależności podmiotów biorących udział w grze rynkowej prowadzić mogą do wyboru nieefektywnych strategii gry. Skutek określonej decyzji danego gracza uzależniony jest od decyzji innych graczy stąd ich 4 „Ponieważ nie wszyscy nabywcy zachowują się zgodnie z kontraktem względnie z należytą starannością, a oferenci kalkulują swoje ceny w taki sposób, aby nie ponieść straty, w cenach pojawia się premia za ryzyko. W ten sposób uczestnicy spełniający warunki kontraktu obciążeni są względnie wysoką ceną i dlatego skłonni są rezygnować z nabywania pewnych dóbr, a w ekstremalnej sytuacji nie są zawierane dalsze transakcje z uczciwymi uczestnikami rynku i rynek zawodzi, ponieważ z powodu wysokiej ceny na rynku pozostają jedynie oportuniści.” [6] 5 Z taką sytuacją możemy mieć miejsce wówczas, gdy nawiązanie współpracy wiąże się z poniesieniem przez jedną ze stron istotnych kosztów o charakterze nieodwracalnym (tzw. koszty utopione – sunk costs), które zwrócić się mogą jedynie w przypadku ostatecznego sfinalizowania transakcji. W takim przypadku istnieje niebezpieczeństwo wyzysku przez drugą stronę, która mając świadomość poczynionych przez partnera inwestycji stawia go przed alternatywą zerwania współpracy, lub nawiązania jej na nowych, mniej korzystnych dla partnera warunkach. 1.2. INFORMACJA A SYSTEM RYNKOWY 9 nieznajomość przekłada się na niepewność odnośnie ostatecznego wyniku gry, a zatem i stopnia realizacji założonego celu każdego z graczy. Konkurenci (aktualni i potencjalni) oraz ich decyzje definiują bowiem tak stan otoczenia jak i zasadę, o których uprzednio była mowa. Dopóki decyzje konkurentów nie są faktem, nie zostały podjęte, dany gracz stoi przed koniecznością ich przewidywania. (Rzecz jasna przewidywania te dotyczyć muszą również kwestii rozpoznania, kto w ogóle jest konkurentem.) Decyzje te uzależnione są od celów konkurencyjnych graczy, od dostępnych sposobów ich realizacji (strategii gry) jak również od posiadanej przez nich informacji, w tym informacji na poziomie wyżej omawianych relacji handlowych, na poziomie regulacyjnym (o czym będzie dalej mowa) jak również informacji o celach, dostępnych strategiach i posiadanej informacji graczy względem nich konkurencyjnych. Ograniczoność dostępu do informacji na każdym z poziomów i w kontekście każdego z zagadnień zwiększa niepewność funkcjonowania systemu rynkowego. Ograniczenia informacyjne na poziomie regulacyjnym Ograniczenia informacyjne na poziomie regulacyjnym (szerzej prawnym) rozpatrywać można z punktu widzenia podmiotów regulujących jak i poddanych regulacji. Podmioty regulujące określają (próbują określać) kształt mechanizmu rynkowego, wyznaczają właściwe mu granice i to tak na poziomie relacji handlowych jak i na poziomie konkurencji. Od decyzji prawodawców i regulatorów uzależnione bywa to, jacy gracze funkcjonują na rynku, jakie strategie gry są dla nich dostępne, jaką posiadają informację, jakie ustalają się ceny i do kogo trafiają wytwarzane na rynku dobra. Regulacja z definicji jest działaniem dążącym do poprawy efektywności funkcjonowania rynku lub do wyboru określonej efektywności, określonego rozwiązania efektywnego, Pareto-optymalnego, pożądanego ze względu na cele określonej polityki. Rynek nie jest bytem statycznym, lecz żywym organizmem rządzącym się własnymi prawami. Stąd też regulacja, by była efektywną potrzebuje informacji na jego temat. Wszelkie informacje, o których mowa była w związku z ograniczeniami informacyjnymi na poziomie relacji handlowych i na poziomie konkurencji, są więc niezbędne jeśli chce się przewidzieć jej skutek. Wniosek stąd, że pozbycie się niepewności na poziomie regulacyjnym wymagałoby zgromadzenia największej (względem poziomu relacji handlowych i poziomu konkurencji) ilości informacji na temat całego systemu rynkowego. Wynika to w głównej mierze stąd, iż wiele regulacji (a wszystkie przepisy prawa) ma charakter uprzedzający (ex ante) względem konkretnych decyzji graczy rynkowych czy nabywców dóbr. Z punktu widzenia podmiotów poddanych regulacji istotnym jest posiadanie informacji na temat aktualnego systemu prawno-regulacyjnego, jak również środków, które w przyszłości 10 ROZDZIAŁ 1. NIEPEWNOŚĆ I RYZYKO W GRACH RYNKOWYCH zostaną wdrożone. Innymi słowy niepewność na poziomie regulacyjnym w funkcjonowaniu podmiotów poddanych regulacji wynikać może albo z braku informacji na temat aktualnego stanu systemu prawno-regulacyjnego, albo z niestabilności tego systemu i braku informacji na temat przyszłego jego kształtu. 1.2.3 Informacja o rynku a rynek informacji Niepewność związana z funkcjonowanie systemu rynkowego może być (i w praktyce jest) zmniejszana poprzez różnego rodzaju systemy informacyjne, których celem jest przekazywanie poszczególnym podmiotom koniecznych im informacji. Budowa tych systemów, a jeszcze bardziej pozyskanie stosownej informacji nie jest bynajmniej zadaniem prostym. Oczywistym kłopotem jest tu ilość informacji wynikająca ze złożoności samego systemu rynkowego i związana z tym trudność jej pozyskiwania, gromadzenia, selekcjonowania i dystrybucji do właściwych adresatów. Z tego też względu (jak również z innych powodów) same systemy informacyjne niejednokrotnie stają się osobnym systemem rynkowym, na którym oferowanym i kupowanym dobrem jest sama informacja. Rzecz jasna i ten system podlega ograniczeniom informacyjnym (na różnych poziomach) prowadząc niejednokrotnie do zawierania transakcji niekorzystnych lub niezawierania transakcji korzystnych, czyniąc w efekcie ów system nieefektywnym. Istnieje tu oczywista trudność w kontekście próby usprawniania rynkowego systemu informacyjnego: nie można go usprawnić za pomocą lepszego (innego) systemu informacyjnego, bowiem informacja na temat informacji jest w gruncie rzeczy tą samą informacją. To kolejny powód istnienia niepewności i ryzyka, a co się z tym wiąże możliwej nieefektywności działania pierwotnego rynku dóbr (nieinformacyjnych). 1.3 Źródła niepewności i ryzyka w rzeczywistych grach rynkowych Konsumenci i regulatorzy rynku są podmiotami względem danego rynku zewnętrznymi : kształtują warunki jego funkcjonowania (determinują stan otoczenia i zasadę) nie są jednakże uczestnikami gry rynkowej w takim sensie, jak to dotyczy podmiotów odpowiedzialnych za wytwarzanie dóbr podlegających na tym rynku wymianie. W szczególności nie stosownym jest stwierdzenie odnośnie potencjalnego ich wejścia na rynek. W tym sensie konsumenci i regulatorzy nie są graczami rynkowymi, nie są uczestnikami gry. Raczej kreują gry, w które grają rzeczywiści gracze – podmioty prowadzące działalność gospodarczą (w szczególności przedsiębiorstwa telekomunikacyjne). W tym punkcie dokonamy opisu szeregu zjawisk, które przyczyniają się do tego, że czynny udział w grze rynkowej (bycie graczem na danym rynku) jest działalnością obarczoną ryzykiem. 1.3. ŹRÓDŁA NIEPEWNOŚCI I RYZYKA W RZECZYWISTYCH GRACH RYNKOWYCH 11 Pierwszym źródłem niepewności i ryzyka dla każdego gracza rynkowego jest jego własna, wewnętrzna sytuacja (zależna oczywiście od czynników zewnętrznych). Poniżej w sposób przykładowy wymieniono niektóre z nich. • Ryzyko związane z organizacją i harmonizacją wewnętrznych procesów w firmie procesów, w tym z właściwą obsługą stosowanych urządzeń i maszyn, zachowaniem harmonogramu prac itp. • Ryzyko związane ze stosowaną technologią i wykorzystywanymi środkami technicznymi. Źródłem ryzyka są tu kwestie właściwego doboru technologii, umiejętności przewidywania postępu w tym zakresie, jakości wytwarzanych produktów itp. • Ryzyko na poziomie zarządzania, w tym ryzyko związane z logistyką, z utrzymaniem lub zdobyciem pożądanej pozycji na rynku, z zachowaniem zgodności z obowiązującym prawem, z niebezpieczeństwem uzależnienia od posiadanej kadry, lub zwolnienia przydatnych pracowników, z właściwym rozpoznaniem czynników makroekonomicznych (jak inflacja, stopy procentowe, kurs walut, kurs akcji) i mikroekonomicznej (popyt na określone usługi) czy sytuacji polityczno-ekonomicznej itp. • Ryzyko finansowe, w tym ryzyko związane z trafnością przyjętej ceny, z szacunkiem ponoszonych kosztów, z zapewnieniem płynności finansowej i zdolności kredytowej, z utrzymaniem udzielonych lub otrzymanych gwarancji, z poczynionymi inwestycjami itp. • Ryzyko związane z dążeniem do zachowania lub zdobycia dobrej reputacji u klientów, partnerów i podmiotów wspierających. Drugim źródłem ryzyka dla każdego gracza rynkowego jest wewnętrzna sytuacja rynkowa (w tym podejmowane przez innych graczy decyzje), jak również jego zewnętrzne uwarunkowania (popyt na oferowane produkty czy usługi, ramy prawne, kondycja rynków spokrewnionych, lub ogólnej gospodarki itp.). W tym kontekście źródłem ryzyka staje się również zasadnicza strategia, jaką w grze zamierza przyjąć dane przedsiębiorstwo i jej właściwe dopasowanie do wewnętrznych i zewnętrznych uwarunkowań rynku. Zasadniczo wyróżnia się trzy rodzaje strategii [104]: 1. Wiodąca pozycja pod względem kosztów całkowitych, polegająca na dążeniu do minimalizacji kosztów świadczonych usług przy wytwarzanych produktów, a co się z tym wiąże minimalizacji cen. 2. Zróżnicowanie, czyli dążenie do wprowadzenia na rynek unikatowego i trudnego do imitowania produktu lub usługi, w tym wbudowanie w ofertę takich atrybutów produktu lub systemu współpracy, które zwiększają satysfakcję odbiorcy. 12 ROZDZIAŁ 1. NIEPEWNOŚĆ I RYZYKO W GRACH RYNKOWYCH 3. Koncentracja, czyli adresowanie swoich usług lub produktów do ściśle określonej grupy odbiorców, świadczenie ściśle i wąsko określonego asortymentu wyrobów, czy skupienie się na określonym rynku geograficznym. Strategia wiodącej pozycji pod względem kosztów całkowitych narażona jest na ryzyka związane ze: • Zmianą techniczną niweczącą poprzednie inwestycje lub przewagę zdobytą w wyniku uczenia się; • Dochodzeniem do niskich kosztów przez nowo wchodzących do danego sektora lub przez konkurentów, w wyniku naśladownictwa albo przez możliwość zainwestowania w urządzenia odpowiadające najnowszej technice; • Niedostrzeganiem potrzeby dokonania zmian w wyrobach lub w marketingu, ze względu na nadmierną uwagę poświęconą kosztom; • Inflacją kosztów, ograniczającą możliwość utrzymania przez firmę różnicy cen równoważącej prestiż znaków firmowych konkurentów lub stosowanie innych sposobów różnicowania wyrobów. Zróżnicowanie wiąże się z ryzykiem wówczas, gdy: • Różnica kosztów między konkurentami o niskich kosztach a zróżnicowaną firmą staje się zbyt duża; nabywcy, mimo przywiązania do marki, rezygnują z niektórych cech, usług czy prestiżu zróżnicowanej firmy na rzecz dużych oszczędności, • Zmniejsza się zapotrzebowanie nabywców na to, co stanowi przedmiot zróżnicowania; zjawisko to może wystąpić w miarę zwiększania się wyrafinowania nabywców, • Naśladownictwo zmniejsza dostrzegalne zróżnicowanie; sytuacja taka często występuje w miarę dojrzewania danego sektora. Koncentracja jest ryzykowna gdy: • Zwiększa się różnica kosztów między konkurentami działającymi na szeroką skalę a firmą skoncentrowaną, co eliminuje korzyści kosztowe wynikające z obsługiwania wąskiego rynku albo równoważy zróżnicowanie wynikające z koncentracji, • Różnice w wyrobach lub usługach pożądanych przez wybrany strategiczny segment i przez cały rynek zmniejszają się, • Konkurenci wyszukują węższe podsegmenty w wybranym segmencie strategicznym, uzyskując jeszcze większą koncentrację niż firma koncentrująca się. 1.4. PODSUMOWANIE I WNIOSKI 1.4 13 Podsumowanie i wnioski Liczba czynników wpływających na wynik gry rynkowej nie jest mała. Brak informacji na ich temat rodzi trudność z oszacowaniem skutków podjętych przez graczy rynkowych (jak również konsumentów i regulatorów) decyzji. Trudność z oszacowaniem skutków rodzi trudność z samym podjęciem decyzji: proces podejmowania decyzji staje się procesem niepewnym, ryzykownym, a przyszłość nabiera w określonych granicach znamion przypadkowości – tym większych, im mniej informacji posiadają podmioty podejmujące decyzje. W pewnym zakresie istniejące ograniczenia informacyjne mogą być pokonywane. Całkowita ich eliminacja nie jest jednakże możliwa w realnych sytuacjach rynkowych. Dlatego też sytuacje te będą zawsze sytuacjami gry (z racji na istniejące na rynku interakcje) w warunkach niepewności czy ryzyka (z racji na ograniczenia informacyjne). I dlatego też właściwym narzędziem analizy tego typu sytuacji, jak również narzędziem wspomagającym decyzje graczy rynkowych jest metodologia teorii gier, w szczególności zaś gier z niepełną informacją [28, 29, 41, 46, 49, 50, 51]. 14 ROZDZIAŁ 1. NIEPEWNOŚĆ I RYZYKO W GRACH RYNKOWYCH Rozdział 2 Model konkurencyjnej gry rynkowej W niniejszym rozdziale przedstawiony zostanie przyjęty model gry na konkurencyjnym1 rynku telekomunikacyjnym [44, 47]. Do jego opracowania wykorzystano pojęcia teorii gier. 2.1 Podstawowe pojęcia teorii gier Teoria gier to w najprostszym ujęciu matematyczna teoria konfliktu i kooperacji. Jej pierwsze fundamentalne pojęcia i zależności zostały sformułowane w 1928 roku przez Johna von Neumanna w pracy „Zur Theorie der Gesellschaftsspiele”. Pierwsza monografia na temat teorii gier „Theory of Games and Economic Behavior” autorstwa Johna von Neumanna i Oskara Morgensterna opublikowana została w roku 1944. Teoria gier wprowadza w obszar myśli ludzkiej bogaty aparat pojęciowy i zestaw metod analizy i rozwiązywania różnego typu sytuacji o charakterze konfliktu i kooperacji. Sytuacje te, a właściwie ich modele nazywa się po prostu grami [14, 66, 83, 90, 98, 102]. Gry klasyfikuje się w różny sposób. W zależności od liczby uczestników – graczy, biorących udział w grze, przyjął się podział na gry 2-osobowe i N-osobowe 2 . W zależności od stopnia sprzeczności wzajemnych interesów graczy dzieli się gry na gry o sumie zerowej i gry o sumie 1 Charakterystyczną cechą rynku telekomunikacyjnego jest to, iż nie jest on jedynie konkurencyjny. Z racji na swą specyfikę równie dobrze określić go można jako rynek kooperacyjny. W istocie bowiem podmioty (operatorzy sieci, dostawcy usług) wielokrotnie pozostają ze sobą z jednej strony w relacji konkurowania o dostęp do ograniczonych zasobów (np. dostęp do abonentów), a z drugiej w relacji współpracy, z racji na konieczność zapewnienia łączności pomiędzy użytkownikami usług, będących abonamentami różnych sieci. 2 Pojęcie osoby nie ma tu rzecz jasna znaczenia antropologicznego, tak samo jak gracz nie implikuje wprost skojarzeń ze sportem czy hazardem. Pojęcia te używane są dla określenia podmiotu zaangażowanego w konflikt, przy czym podmiot ten może być tak zarówno konkretną osobą, jak i grupą osób, a także „naturą”, słowem stroną zaangażowaną w konflikt. 15 16 ROZDZIAŁ 2. MODEL KONKURENCYJNEJ GRY RYNKOWEJ niezerowej. W grach o sumie zerowej3 wielkość wygranej, tzw. wypłata, jaką uzyskuje jeden z graczy jest dokładnie równa sumie strat, jakie ponoszą gracze pozostali. W grach o sumie niezerowej taka zależność nie musi zachodzić i w szczególnych przypadkach zyskiwać może wielu lub nawet wszyscy. Tu często rozważa się przypadki możliwej kooperacji między graczami. Wyróżnia się różne sposoby reprezentacji gier – różne modele gier. I tak mamy: • Gry w postaci ekstensywnej, czyli w postaci tzw. drzewa decyzyjnego. • Gry w postaci normalnej, w których wartość wypłaty yi dla i-tego gracza definiuje się w postaci funkcji wygranej fi , będącej zależnością wiążącą wartość wypłaty yi z decyzjami wszystkich N graczy yi = fi (x1 , . . . , xi , . . . , xN ), przy czym zmienna xi może być wektorem decyzji elementarnych. Szczególnym przypadkiem gier w postaci normalnej są tzw. gry macierzowe, kiedy to zbiór decyzji (nazywanych tu strategiami ) poszczególnych graczy jest dyskretny, a zbiór wypłat dla poszczególnych graczy przedstawia się w formie macierzy. • Gry w postaci funkcji charakterystycznej, w których każdemu podzbiorowi graczy S ⊆ N (tzw. koalicji) przypisuje się wartość wypłaty v(S). Wyróżnić można również podział na gry jednorazowe i powtarzalne 4 . Kluczowym w teorii gier jest pojęcie strategii. Rozumie się ją tu jako decyzję, w szczególnym przypadku złożoną ze zbioru decyzji cząstkowych (wektor zmiennych decyzyjnych), ewentualnie sekwencję decyzji, jakie gracz może podjąć. Pojęciu podjęcie decyzji odpowiada tu pojęcie wyboru strategii Tabela 2.1 ilustruje wzajemną zależność między pojęciami strategii i wypłaty dla dwóch graczy - gracza A i gracza B. Jest to tzw. macierz wypłat. W macierzy tej zilustrowano wypłaty zarówno gracza A, jak i gracza B. Gracze mają tu do wyboru po cztery strategie - gracz A strategie a1 , a2 , a3 i a4 , gracz B natomiast strategie b1 , b2 , b3 i b4 . Jeśli gracz A wybierze strategię ai , a gracz B strategię bj , to otrzymają oni w ten sposób wypłaty - odpowiednio VjA (ai ) i ViB (bj ). W zależności od zakresu posiadanych informacji wyróżnić można gry o pełnej informacji (with complete information – C-games) oraz gry o informacji niepełnej (with incomplete information – I-games) [28, 29, 62, 63]. 3 4 Tego typu gry nazywa się również grami o sumie stałej. Grę powtarzalną traktować można jako wielokrotne rozgrywanie gry jednorazowej. Innym podejściem do problemu wielokrotnie rozpatrywanych sytuacji growych są modele gier dynamicznych, czy ewolucyjnych [98]. 2.2. MODELE GRY RYNKOWEJ NA KONKURENCYJNYM RYNKU TELEKOMUNIKACYJNYM 17 Tabela 2.1: Ilustracja pojęć strategia i wypłata. b1 b2 b3 .. . b4 ...... ...... [V3A (a2 ), V2B (b3 )] .. . .. . ...... a1 a2 a3 a4 2.2 Modele gry rynkowej na konkurencyjnym rynku telekomunikacyjnym Model gry rynkowej na konkurencyjnym rynku telekomunikacyjnych został opracowany przez Autora we wcześniejszych pracach [44, 47]. Dla jasności wywodów przeprowadzanych w tej pracy zostanie on tu szczegółowo przedstawiony. Na wstępie zidentyfikowane zostanie czemu w realnej sytuacji konkurencyjnej odpowiada omawiane wcześniej pojęcie gry, kto jest w tej grze graczem, jakie ma do dyspozycji strategie i jaką postać przybierają odpowiednie funkcje wypłat. Problemy te są wzajemnie powiązane. Określenie czym jest gra rynkowa dokonuje się najpierw poprzez identyfikację samego rynku. Następnie poprzez identyfikację funkcji wypłat, co implikuje konieczność określenia graczy, którym te funkcje odpowiadają. Określenie strategii wiąże się z identyfikacją zmiennych decyzyjnych każdego z graczy, których wartość w sposób istotny wpływa na wartość funkcji wypłat. 2.2.1 Identyfikacja rynków Identyfikacja rynku opiera się na kryterium oferowanego produktu lub usługi (kryterium przedmiotowe) oraz na wymiarze geograficznym, z uwzględnieniem kryterium podmiotowego, a niekiedy również i czasowego [3]. Właściwy rynek produktowy obejmuje te wszystkie towary i usługi, które są uznawane przez konsumenta za wzajemnie wymienne lub substytucyjne ze względu na ich właściwości, ceny i przeznaczenie. Definiowanie rynku w wymiarze geograficznym odwołuje się do pojęcia konkurencji. Właściwy rynek geograficzny obejmuje obszar objęty działalnością dostawców lub sprzedawców produktów, na którym warunki konkurencji są podobne lub jednolite. W sektorze telekomunikacyjnym wymiar geograficzny rynku determinowany jest przede wszystkim obszarem sieci. I tak definiuje się rynki lokalne, regionalne, krajowe lub ponadnarodowe. Kryterium podmiotowe dzieli rynki telekomunikacyjne na detaliczne, związane ze świadcze- 18 ROZDZIAŁ 2. MODEL KONKURENCYJNEJ GRY RYNKOWEJ niem usług użytkownikom końcowym oraz na rynki hurtowe, związane z zapewnianiem dostępu do sieci innym przedsiębiorstwom telekomunikacyjnym. Kryterium czasowe dzieli rynki z punktu widzenia okresu czasowego, w jakim świadczone są usługi. Swoisty podział rynków dokonuje się również z racji na kształt regulacji prawnych, a ściślej mówiąc na podział na tzw. regulację ex ante (regulację wyprzedzającą) i regulację ex post [70]. Dla przykładu podamy klasyfikację rynków podaną przez Komisję Europejską w rekomendacji 2003/311/EC [9]. Są to tzw. rynki właściwe, związane z wyznaczaniem pozycji przedsiębiorstwa, a w szczególności z identyfikacją przedsiębiorstwa o znaczącej pozycji rynkowej. Rekomendacja wymienia: • Na rynku detalicznym: 1. Rynek dostępu do abonentów domowych (residential ) o stałej lokalizacji w publicznej sieci telefonicznej. 2. Rynek dostępu do abonentów biznesowych (non-residential ) o stałej lokalizacji w publicznej sieci telefonicznej. 3. Rynek publicznie dostępnych usług telekomunikacyjnych na poziomie lokalnym i/lub krajowym dla abonentów domowych o stałej lokalizacji. 4. Rynek publicznie dostępnych usług telekomunikacyjnych na poziomie międzynarodowym dla abonentów domowych o stałej lokalizacji. 5. Rynek publicznie dostępnych usług telekomunikacyjnych na poziomie lokalnym i/lub krajowym dla abonentów biznesowych o stałej lokalizacji. 6. Rynek publicznie dostępnych usług telekomunikacyjnych na poziomie międzynarodowym dla abonentów biznesowych o stałej lokalizacji. 7. Rynek oferowania minimalnego zbioru łączy dzierżawionych. • Na rynku hurtowym: 1. Rynek usług rozpoczęcia połączenia (call origination) w publicznej sieci telekomunikacyjnej, dostarczanych użytkownikom o stałej lokalizacji. 2. Rynek usług zakończenia połączenia (call termination) w publicznej sieci telekomunikacyjnej, dostarczanych użytkownikom o stałej lokalizacji. 3. Rynek usług tranzytu ruchu w stałej publicznej sieci telefonicznej. 4. Rynek hurtowego dostępu do uwolnionej metalowej pętli i podpętli abonenckiej dla celów świadczenia szerokopasmowych i głosowych usług. 5. Rynek hurtowego szerokopasmowego dostępu do infrastruktury sieciowej. 2.2. MODELE GRY RYNKOWEJ NA KONKURENCYJNYM RYNKU TELEKOMUNIKACYJNYM 19 6. Hurtowy rynek łączy dzierżawionych dla potrzeb zakończenia połączeń (Wholesale terminating segments of leased lines). 7. Hurtowy rynek łączy dzierżawionych dla potrzeb tranzytowych (Wholesale trunk segments of leased lines). 8. Rynek dostępu i rozpoczęcia połączenia w publicznej ruchomej sieci telefonicznej. 9. Rynek usług zakończenia połączenia w ruchomej sieci telefonicznej. 10. Narodowy rynek hurtowy międzynarodowych usług roamingowych w publicznych sieciach ruchomych. 11. Rynek usług transmisji rozsiewczej. 2.2.2 Identyfikacja graczy Identyfikacja graczy w grze rynkowej zdaje się być zagadnieniem prostym. Graczami w grze na danym rynku telekomunikacyjnym są przede wszystkim przedsiębiorstwa telekomunikacyjne prowadzące na tym rynku działalność. Uwzględnić jednakże trzeba również istnienie tzw. rynków wzajemnie powiązanych, czyli takich, że istnieje możliwość przenoszenia władzy rynkowej z jednego na drugi [70]. Dla przykładu decyzje co do wysokości taryf za usługi telekomunikacyjne ustanawiane przez operatorów lokalnych mają istotny wpływ na wyniki, jakie osiągają operatorzy międzystrefowi i odwrotnie. I o ile w przypadku, gdy operator międzystrefowy jest podmiotem niezależnym względem operatorów lokalnych, wpływ na wyniki tych ostatnich będzie zasadniczo podobny (efekty rozłożone względnie równomiernie), o tyle w przypadku, gdy operator międzystrefowy jest jednocześnie jednym z operatorów lokalnych, efekt ujęty całościowo może być radykalnie różny5 . Niejednoznaczną jest tu kwestia roli regulatora. Możliwym jest podejście, w którym regulatora traktuje się jako jednego z graczy, mającego dla danego rynku własny zbiór strategii (możliwych do użycia instrumentów prawno-administracyjnych), oraz celów, związanych z realizowaną polityką, które traktować można jako punkty aspiracji w przestrzeni kryteriów oceny stanu sytuacji rynkowej, czyli jego funkcji wypłat. W innym ujęciu regulatora nie traktuje się jako jednego z graczy, lecz jako ograniczenie na zbiór dopuszczalnych strategii działających na rynku przedsiębiorstw. To podejście, poparte nota bene potocznym rozumieniem pojęcia gracz rynkowy, jest o tyle słuszne, iż w momencie „rozgrywania gry” przepisy prawne są już (z reguły) ustalone, a wynikające z nich decyzje regulatora w najgorszym przypadku łatwe do przewidzenia. W niniejszej pracy przyjmiemy to drugie podejście. 5 Wiąże się to z problemem tzw. krossubsydiowania, czyli wspieraniem jednej, mniej dochodowej działalności przez inną, bardziej dochodową. 20 ROZDZIAŁ 2. MODEL KONKURENCYJNEJ GRY RYNKOWEJ 2.2.3 Identyfikacja strategii Postrzeganie usługi z punktu widzenia jej użytkownika, jak i podmiotu, który ją świadczy może być bardzo różne. Użytkownik widzi usługę w jej formie finalnej, podczas gdy dostawca usługi widzi jej elementy składowe. Wprowadźmy zatem następującą definicję: Definicja 2.2.1 Jednostką usługową – SUAipm nazywamy elementarną część m usługi bądź usług, świadczonych przez przedsiębiorstwo A, w i-tej strefie (np. strefie numeracyjnej), dla użytkownika o profilu p, z którą związana jest pobierana od użytkownika opłata PAipm . Jednostka usługowa jest pojęciem ogólnym (tak jak ogólnym jest pojęcie użytkownika [70]) i dotyczyć może usług świadczonych zarówno na rynku detalicznym, jak i hurtowym. W szczególności jednostka usługowa może być samą usługą, jak to jest np. w przypadku usługi związanej z zapewnieniem dostępu do sieci, z którą związana jest stała opłata abonamentowa lub też częścią usługi, jak to jest dla przykładu z usługą rozpoczęcia połączenia, która może wchodzić w skład usługi połączenia, realizowanego między abonentami dwóch różnych sieci. Pojęcie jednostki usługowej może być również przypisane do usługi, z uwzględnieniem rozróżnienia na czas jej świadczenia. Dla przykładu usługa lokalnego połączenia telefonicznego w godzinach szczytu stanowić może inną jednostkę usługową, niż ta sama usługa świadczona w godzinach poza szczytem, jeśli tylko świadczący ją operator uwzględniał będzie możliwość ustalenia w obu przypadkach różnych cen6 . Korzystając z powyższej definicji jednostki usługowej SUAipm oraz odpowiadającej jej ceny PAipm zdefiniujemy pojęcie strategii: j )}. Definicja 2.2.2 Strategią aj przedsiębiorstwa A nazywamy zbiór par {(SUAipm , PAipm Zgodnie z definicją 2.2.2 strategia aj będzie strategią identyczną ze strategią ak wtedy i tylko wtedy, gdy dla każdej jednostki usługowej SUAipm , zachodzić będzie zależność: j k PAipm = PAipm Strategia aj będzie natomiast strategią różną od strategii ak , jeśli dla co najmniej jednej jednostki usługowej SUAipm , zachodzić będzie zależność: j k PAipm 6= PAipm 6 Chodzi tu o potencjalną możliwość ustalenia różnych cen, a nie o faktyczną ich różnicę. 2.2. MODELE GRY RYNKOWEJ NA KONKURENCYJNYM RYNKU TELEKOMUNIKACYJNYM 2.2.4 21 Identyfikacja funkcji wypłaty Funkcja wypłaty stanowi kryterium oceny wyniku gry, a zatem i kryterium oceny decyzji (wybranej strategii), jaką podjął dany gracz. Takich kryteriów oceny może być bardzo wiele7 . W niniejszej pracy ograniczymy się do czterech zasadniczych rodzajów kryteriów, bazujących na modelu popytu na świadczone usługi i modelu ponoszonych przez przedsiębiorstwa kosztów. Kryteria popytu i liczby użytkowników Załóżmy istnienie modelu popytu na usługi telekomunikacyjne, składającego się z dwóch modeli składowych8 : XiY j • Model funkcji popytu – DAputn – wielkość ruchu przenoszonego przez sieć operatora A, związanego z realizacją usługi u, w chwili czasowej t i dniu tygodnia n, generowanego przez użytkownika o profilu p w i-tej strefie operatora X, w relacji połączenia z użytkownikiem w j-tej strefie operatora Y . • Model liczby użytkowników – UAip – liczba użytkowników o profilu p, korzystających z usług przedsiębiorstwa A, w i-tej strefie numeracyjnej. Dla modelu funkcji popytu w szczególnym przypadku może zachodzić: • (X = Y = A) – dla ruchu zamykającego się w sieci operatora A (lokalnego, jeśli i = j i międzystrefowego, jeśli i 6= j). • (X = A 6= Y ) – dla ruchu rozpoczynającego się w i-tej strefie operatora A i kończącego się w j-tej strefie operatora Y . • (X 6= A = Y ) – dla ruchu rozpoczętego w i-tej strefie operatora X i kończącego się j-tej strefie operatora A. • (X 6= A 6= Y ) – dla ruchu wychodzącego z sieci operatora X i kierowanego do sieci operatora Y , tranzytowanego przez sieć operatora A. Modele powyższe mają charakter wyjść (outcomes), których wartości zależą (między innymi) od przyjętych w modelu strategii, czyli cen za poszczególne jednostki usługowe. Dlatego też modele te traktować można jako funkcje kryteriów oceny skutku wybranych przez graczy strategii. Są to kryteria elementarne. Na ich podstawie zbudować można wiele różnorodnych kryteriów zaagregowanych. Dla przykładu poniżej podajemy kilka spośród nich. 7 8 Teoretycznie nieskończenie wiele [74]. Przyczynek do powstania takiego modelu znaleźć można w pracy [?]. 22 ROZDZIAŁ 2. MODEL KONKURENCYJNEJ GRY RYNKOWEJ • Kryteria popytu – Kryterium całkowitej wielkości ruchu, związanego z realizacją usługi u, generowanego przez wszystkich użytkowników w i-tej strefie operatora A: DAiu = AiY j DAputn · UAip XXX Y,j p t,n – Kryterium całkowitej wielkości ruchu zamykającego się w strefie i (ruch lokalny), sieci operatora A (ruch generowany w relacji Ai − Ai): DAiAi = X AiAi DAputn · UAip p,u,t,n – Kryterium całkowitego ruchu generowanego w i-tej strefie sieci operatora A i wychodzącego do j-tej strefy operatora B (ruchu generowanego w relacji Ai − Bj): DAiBj = AiBj DAputn · UAip X p,u,t,n – Kryterium całkowitego ruchu przychodzącego z sieci operatora B do sieci operatora A: DBA = BjAi · UBjp DBputn X X i,j p,u,t,n – Kryterium całkowitego ruchu obsługiwanego w sieci przez operatora A w godzinach szczytu (t = s), w dniach pracujących (n = w): DAsw = XX AiAj · UAip + DApusw XX AiY j · UAip + DApusw Y jAi · UY jp DBpusw Y,j,i p,u i,Y,j p,u i,j p,u XX – Kryterium stosunku ruchu przychodzącego do wychodzącego w sieci operatora A, połączonej z siecią operatora B: T /O DA = BjAi X X DBputn · UBjp i,j p,u,t,n AiBj DAputn · UAip • Kryteria liczby użytkowników – Kryterium liczby użytkowników o profilu p przedsiębiorstwa A: UAp = X UAip i – Kryterium całkowitej liczby użytkowników przedsiębiorstwa A: UA = X UAip i,p – Kryterium udziału w rynku użytkowników o profilu p przedsiębiorstwa A: P UAip wzg UAp = P i X,j UXjp 2.2. MODELE GRY RYNKOWEJ NA KONKURENCYJNYM RYNKU TELEKOMUNIKACYJNYM 23 Kryteria kosztów i zysków Jedna z możliwych klasyfikacji dzieli ponoszone przez przedsiębiorstwa koszty na tzw. koszty stałe, niezależne od wielkości produkcji (zakresu oferowanych usług) i na tzw. koszty zmienne, od wielkości produkcji zależne [33, 65, 89]. Z racji na fakt, iż strategie graczy opierają się na cenach za poszczególne jednostki usługowe, stąd też za kosztowe kryteria oceny wyniku gry przyjąć należy te z funkcji kosztów, na których wartość (w sposób pośredni) te ceny mają wpływ. Będą to zatem te spośród funkcji kosztów, które uzależnione są od wielkości przenoszonego ruchu oraz od liczby użytkowników sieci. Dla przykładu mogą to być następujące koszty: XiY j • KAu - koszt zmienny, ponoszony przez przedsiębiorstwo A, związany z przenoszeniem ruchu dla celów realizacji usługi u w relacji Xi − Y j. Przy czym w szczególnym przypadku może zachodzić: – (X = Y = A) – dla ruchu zamykającego się w sieci operatora A (lokalnego, jeśli i = j i międzystrefowego, jeśli i 6= j). – (X = A 6= Y ) – dla ruchu rozpoczynającego się w i-tej strefie operatora A i kończącego się w j-tej strefie operatora Y . – (X 6= A = Y ) – dla ruchu rozpoczętego w i-tej strefie operatora X i kończącego się j-tej strefie operatora A. – (X 6= A 6= Y ) – dla ruchu wychodzącego z sieci operatora X i kierowanego do sieci operatora Y , tranzytowanego przez sieć operatora A. I • KAip – uśredniony koszt instalacji pojedynczego łącza abonenckiego dla użytkownika o profilu p w i-tej strefie operatora A. M - uśredniony koszt utrzymania pojedynczego łącza abonenckiego dla użytkownika o • KAip profilu p w i-tej strefie operatora A. IBP OI • KAl – uśredniony koszt instalacji pojedynczego punktu połączeniowego POI, ponos- zony przez operatora A łączącego swą sieć z siecią operatora B, na l-tym poziomie interconnectu9 . M BP OI • KAl – uśredniony koszt utrzymania pojedynczego punktu połączeniowego POI (point of interconnect), ponoszony przez operatora A połączonego z operatorem B, na l-tym poziomie interconnectu. 9 Przez poziom interconnectu rozumiemy jeden z czterech możliwych przypadków: bezpośredni dostęp do pętli abonenckiej (l = 0), połączenie na poziomie lokalnym (l = 1), połączenie na poziomie międzystrefowym z pojedynczym tranzytem (l = 2), połączenie na poziomie międzystrefowym z podwójnym tranzytem (l = 3). Połączenia międzynarodowe traktować można jako ostatni z wymienionych poziomów (l = 3). 24 ROZDZIAŁ 2. MODEL KONKURENCYJNEJ GRY RYNKOWEJ Kryteria kosztowe definiować można dla poszczególnych jednostek usługowych, dla ich grup, dla poszczególnych rynków, dla usług związanych z przenoszeniem ruchu w określonej relacji, jak również w sensie całkowitego kosztu ponoszonego przez przedsiębiorstwo. Zysk ZA przedsiębiorstwa A definiowany jest jako różnica osiąganych przez nie przychodów RA , oraz ponoszonych kosztów KA . ZA = RA − KA Przychody czerpane są z wszelkiej działalności usługowej (z każdej jednostki usługowej SU ), jaką przedsiębiorstwo prowadzi, a ich całkowita wartość wyraża się zależnością RA = X DAipm · PAipm i,p,m gdzie DAipm jest ilością oferowanej jednostki usługowej SUAipm . Podobnie jak rzecz się ma w przypadku kryteriów kosztowych, kryteria zysku definiować można dla poszczególnych jednostek usługowych, dla ich grup, dla poszczególnych rynków, dla usług związanych z przenoszeniem ruchu w określonej relacji, jak również w sensie całościowego wyniku finansowego przedsiębiorstwa. Jakościowy podział kryteriów W zależności od preferencji gracza (przyjętej polityki działania), każde z wyżej wymienionych kryteriów może być maksymalizowane, minimalizowane lub stabilizowane10 . Każdy rodzaj kryterium sprowadzić można w sposób prosty do kryterium maksymalizowanego. Zachodzą bowiem następujące zależności: minimizef = maximize − f oraz stabilizef = maximize 1 ˆ |f − f | + 1 gdzie fˆ jest wartością funkcji f , wokół której chcemy ją stabilizować. 2.3 Rodzaje gier na rynku telekomunikacyjnym i ich własności Pojedyncze kryterium oceny wyniku gry rozpatrywane na danym rynku (np. kryterium maksymalizacji zysku czerpanego z telefonicznych usług lokalnych) definiuje nam jednokryterialną grę rynkową. Liczba jednokryterialnych gier rynkowych odpowiada liczbie możliwych i rozsądnie wybranych kryteriów oceny wybranej strategii. Z jednokryterialnych gier rynkowych możemy 10 Uzasadnienie tego stwierdzenia znaleźć można w pracach [44, 47]. 2.3. RODZAJE GIER NA RYNKU TELEKOMUNIKACYJNYM I ICH WŁASNOŚCI 25 tworzyć gry wielokryterialne, dla których funkcja wypłaty jest wektorem, którego poszczególne składowe stanowią kryteria oceny z gier jednokryterialnych [98]. Zgodnie z przyjętą klasyfikacją kryteriów dokonać możemy następującego podziału gier jednokryterialnych: • Gry o wielkość ruchu • Gry o liczbę użytkowników • Gry o koszt • Gry o zysk Każda z gier posiada ten sam zbiór możliwych strategii gry11 . Gry te zatem są ze sobą powiązane i decyzje podejmowane w ramach jednej gry wpływają na wyniki uzyskiwane w pozostałych grach. Każdy z graczy rynkowych bierze udział w każdej z gier w tym sensie, że jego decyzje (wybrane strategie) wpływają na wartości funkcji wypłat każdego z graczy w każdej grze. Przyjęta polityka działania, a więc preferencje co do ważności poszczególnych kryteriów oceny, wprowadzają tu pewien porządek – choć gracze biorą udział w każdej grze, to ich zainteresowanie wynikami w każdej z gier może być różne. Powiemy zatem, że gracz gra w daną grę, jeśli jest zainteresowany wynikami tej gry, czyli jeśli traktuje funkcję wypłaty z tej gry jako kryterium (jedyne lub jedno z wielu) oceny wybranej przez siebie strategii. Funkcję wypłaty z gry, w którą gracz gra nazwiemy kryterium istotnym dla gracza. Funkcje wypłat z gier, w które gracz nie gra (choć bierze w nich udział) nazwiemy kryteriami nieistotnymi. Dla poszczególnych rodzajów gier zachodzą następujące właściwości: • Gry o wielkość ruchu – funkcje wypłaty oparte są na modelu popytu. • Gry o liczbę użytkowników – funkcje wypłaty oparte są na modelu liczby użytkowników (element modelu popytu). • Gry o koszt – funkcje wypłaty oparte są na modelu kosztów i modelu popytu. • Gry o zysk – funkcje wypłaty oparte są na modelu popytu i modelu kosztów. 11 Dotyczy to także gier wielokryterialnych. 26 ROZDZIAŁ 2. MODEL KONKURENCYJNEJ GRY RYNKOWEJ Rozdział 3 Modelowe ujęcie ograniczeń informacyjnych w grze rynkowej 3.1 Informacyjna reprezentacja graczy w grze Przynajmniej teoretycznie rzecz ujmując, każdy z elementów przedstawionego w poprzednim punkcie modelu gry rynkowej może być dla danego gracza nieznany. Każdy z elementów tego modelu reprezentuje też różny zbiór zjawisk, faktów, właściwości charakteryzujących rynek, jak i jego otoczenie. O ile więc te zjawiska, fakty i właściwości są dla danego gracza nieznane (o ile nie posiada na ich temat informacji), a więc o ile stanowią źródło określonego rodzaju niepewności czy ryzyka, o tyle też niepewne i obarczone ryzykiem będą i owe elementy modelu. Generalnie gracz reprezentowany jest w przyjętym przez nas modelu przez grę, w którą gra, a ściślej mówiąc przez funkcję wypłaty w tej grze, jak również dostępne w tej grze strategie gry. Ponadto przyjąć można, iż reprezentowany jest również przez cel, do jakiego dąży, który w najprostszym ujęciu może być indywidualnie efektywny (oparty wyłącznie na maksymalizacji własnej funkcji wypłaty) lub antagonistyczny (oparty również na dążeniu do pogorszenia wypłaty innych graczy. Ponadto gracz charakteryzowany jest przez informacje, jakie posiada na temat elementów modelu reprezentujących jego samego, jak również innych graczy. Warto zauważyć, że pomiędzy tymi elementami, reprezentującymi danego gracza w określonej grze nie zachodzi ścisła rozłączność. Dla przykładu, można powiedzieć, że dany gracz reprezentowany jest przez strategie gry, jakie posiada tylko wówczas, gdy jest świadomy, gdy wie, czyli gdy posiada informacje, że właśnie takie strategie gry są dla niego dostępne. Co więcej, świadomość dostępnych strategii gry jest dla danego gracze kompletnie bezużyteczna dopóki nie potrafi ocenić skutków wybrania tych strategii, a więc dopóki nie zna postaci funkcji wypłaty. Jednakże argumentami funkcji wypłaty danego gracza nie są tylko jego własne strategie gry, ale również 27 28 ROZDZIAŁ 3. MODELOWE UJĘCIE OGRANICZEŃ INFORMACYJNYCH W GRZE RYNKOWEJ strategie innych graczy. Innymi słowy znajomość dostępnych własnych strategii gry, jak również własnej funkcji wypłaty pozostaje dla gracza bezużyteczna, dopóki nie zna on możliwych strategii gry innych graczy, bowiem od nich uzależniona jest ostateczna ocena (czyli wartość funkcji wypłaty) skutku wybrania określonej, własnej strategii. Co więcej, znajomość strategii gry innych graczy zakłada w istocie świadomość liczby graczy biorących udział w danej grze. Informacja na temat własnych strategii gry, własnej funkcji wypłaty oraz strategii gry innych graczy (a w tym i liczby tych graczy) stanowi więc minimalny zbiór informacji, jaką musi posiadać dany gracz, aby mógł rozgrywać grę w sposób racjonalny, czyli aby był w stanie racjonalnie oceniać skutki podejmowanych decyzji i działań. Nota bene dokładnie takie założenia czynione są w ramach teorii decyzji w warunkach niepewności, o czym mowa była w rozdziale 1. Ten minimalny zbiór informacji odpowiada w istocie znajomości własnej macierzy gry. Minimalny zbiór informacji, a więc znajomość własnej macierzy gry pozwala danemu graczowi ocenić skutki wyboru różnych własnych strategii, w zależności od strategii wybranych przez innych graczy. Nie jest to jednakże zbiór informacji wystarczający do wybrania właściwej strategii. Aby taką strategię wybrać, dany gracz musi jeszcze posiadać takie informacje, które pozwolą mu przewidzieć lub w szczególnym przypadku poznać strategie, jakie wybiorą inni gracze. Konieczna jest mu więc jeszcze informacja na temat ich macierzy wypłat. Co więcej, z racji na fakt, że gracze podejmują swoje decyzje w oparciu o informację, którą posiadają, to by móc przewidzieć te decyzje, dany gracz musi wiedzieć, jakie informacje posiadają inni gracze, w szczególności zaś (choć nie jedynie, o czym za chwilę) wiedzieć, czy gracze ci znają jego macierz wypłat. Kolejną rzeczą (o czym już wspomniano), którą dany gracz musi poznać, by być w stanie przewidzieć jaką strategię wybiorą inni gracze jest cel, do jakiego ci gracze dążą1 (indywidualnie efektywny lub antagonistyczny [42]). Założenie, że gracze Ci zawsze i wyłącznie dążą do maksymalizacji własnej funkcji wypłaty (cel indywidualnie efektywny) może się okazać błędne. Dla przewidzenia strategii gry, którą wybiorą inni gracze, a co się z tym wiąże właściwego wyboru własnej strategii gry konieczna jest również znajomość kolejności ruchów w grze, czyli kolejności w jakiej poszczególni gracze będą wybierali swoje strategie. Zasadniczo bowiem różna kolejność determinuje wybór różnych strategii [49, 53]. Generalnie, gracze rozgrywają gry w różny sposób (wybierają rożne strategie) w zależności od tego, czy jest to gra jednorazowa, czy rozgrywana wielokrotnie. Często w przypadku gier jednorazowych wynik jest albo trudny do przewidzenia (jak to się dzieje np. w przypadku gry chicken, w której są dwa rozwiązania równowagowe, a każdy z graczy chciałby wybrać inne), albo łatwy do przewidzenia, ale nieefektywny (jak to jest np. w przypadku gry dylemat więźnia, w 1 Rzecz jasna za oczywistość należy przyjąć, że dany gracz zna cel, do którego sam dąży. 3.2. KLASYFIKACJA GIER ZE WZGLĘDU NA INFORMACYJNĄ REPREZENTACJĘ GRACZY 29 której dominujące strategie graczy prowadzą właśnie do takiego wyniku) [83, 90]. W przypadku rozgrywania tego typu gier wielokrotnie gracze uczą się nawzajem swojego sposobu rozgrywania gry, jak również po przez swój sposób grania komunikują innym graczom swoje intencje, co w dłuższej perspektywie ustala określony sposób grania przez wszystkich graczy (często inny, niż w przypadku rozgrywania tej gry w sposób jednorazowy). Dlatego też istotna dla graczy jest informacja na temat, czy gra jest jednorazowa czy powtarzalna. I wreszcie ostatnia rzecz, którą dany gracz musi widzieć na temat innych graczy, aby prawidłowo przewidzieć ich sposób rozegrania gry jest zakres informacji posiadanej przez tych graczy. Gracze ci bowiem uzależniają wybór swojej strategii od przewidywanego sposobu rozegrania innych graczy, a w tym również danego gracza. Innymi słowy, gracz ten musi wiedzieć, co wiedzą inni. Podsumowując przyjąć możemy, że w danej grze gracz reprezentowany jest przez następujące rodzaje informacji, którą posiada lub nie. Są to: 1. Informacja na temat własnej macierzy wypłat; 2. Informacja na temat macierzy wypłat innych graczy; 3. Informacja na temat celu do jakiego dążą inni gracze; 4. Informacja na temat kolejności ruchów graczy w grze (ewentualnie wybranych przez innych graczy strategii, jeśli wykonywali ruch wcześniej); 5. Informacja o tym czy gra jest jednorazowa, czy powtarzalna; 6. Informacja na temat posiadanej informacji przez innych graczy (odnośnie każdego z wyżej wymienionych elementów). 3.2 Klasyfikacja gier ze względu na informacyjną reprezentację graczy Z wcześniejszej analizy wynika, że ze względu na posiadaną informację gracz reprezentowany jest przez sześć różnych zmiennych. Jeśli nawet założyć tylko, że każda ze zmiennych przyjmować może jedynie dwie wartości (co jest bez wątpienia założeniem silnie upraszczającym2 ) to i tak mielibyśmy 26 = 64 różne informacyjne reprezentacje danego gracza, a to w istocie 2 Podział binarny jest tu o tyle upraszczający, że nie uwzględnia informacji częściowych. I tak sytuacja częś- ciowej znajomości macierzy wypłat danego gracza jest bez wątpienia sytuacją inną, niż sytuacja całkowitej znajomości lub nieznajomości tejże macierzy. 30 ROZDZIAŁ 3. MODELOWE UJĘCIE OGRANICZEŃ INFORMACYJNYCH W GRZE RYNKOWEJ oznacza tyleż samo różnych rodzajów gier, które dla pełnego wyczerpania tematu analizy ich informacyjnych aspektów należałoby rozważyć. Dlatego też pożądanym jest poszukiwanie jakiegoś bardziej ogólnego podejścia, jakiejś klasyfikacji, która pozwoli na istotne zredukowanie liczby przypadków wymagających osobnej analizy. Ścieżka w tym względzie została już przetarta przed bez mała 40-tu laty przez John’a C. Harsanyi [28, 29, 62, 63], za co nota bene otrzymał później nagrodę Nobla. Szczegółowo metoda, którą zaproponował Harsanyi do analizy gier z ograniczeniami informacyjnymi została przedstawiona w rozdziale 4 niniejszej pracy. W tym miejscu przybliżymy jedynie jej podstawowe założenia, a co się z tym wiąże ograniczenia, co pozwoli nam na dokonanie ogólnej klasyfikacji gier z ograniczeniami informacyjnymi i wskazanie kierunku dalszych badań. Harsanyi wprowadza pojęcie typu gracza. Typ gracza określa jego macierz wypłat, cel do jakiego dąży, jak również informacje, jakie posiada. Każdy gracz może być reprezentowany przez wiele typów (gracze mogą mieć różne macierze wypłat, różne cele i różną wiedzę), jednakże w danym przypadku, w określonej grze każdy z graczy reprezentowany jest tylko przez jeden z możliwych dla niego typów. Typ ten nazwany jest aktywnym typem w grze. Każdy z graczy wie, jakiego jest typu (który z jego typów jest typem aktywnym). Nie wie jednakże, jakiego typu są inni gracze. Harsanyi zakłada, że powszechnie dostępna jest informacja na temat prawdopodobieństwa, że dany gracz jest określonego typu (że dany typ określonego gracza jest typem aktywnym). W oparciu o tę informację (informację na temat prawdopodobieństw, że poszczególni gracze są określonych typów), jak również informację na temat tego, jaki typ aktualnie reprezentuje danego gracza w grze (który z jego typów jest typem aktywnym), gracz określa prawdopodobieństwo (prawdopodobieństwo warunkowe), że inni gracze są reprezentowani przez konkretne ich typy. W oparciu o te prawdopodobieństwa, jak również własną funkcję użyteczności (funkcję wypłaty, która jest mu znana z racji na znajomość własnego typu), gracz ten definiuje nową funkcję użyteczności (tzw. semi-warunkową funkcję użyteczności ), która definiuje nową grę, która jak dowodzi Harsanyi jest już grą z pełną informacją. Harasnyi zakłada ponadto, że gracze wykonują ruchy jednocześnie, a więc właściwym rozwiązaniem tej nowej gry jest po prostu jedno z rozwiązań równowagowych w sensie Nasha [64]. Ta krótka charakterystyka podejścia zastosowanego przez Harsanyi pokazuje, że uwzględnia ono przypadki, w których dany gracz może lecz nie musi nie posiadać: • Informacji na temat macierzy wypłat innych graczy; • Informacji na temat celu do jakiego dążą inni gracze; • Informacji na temat posiadanej informacji przez innych graczy (odnośnie każdego z wyżej wymienionych elementów). 3.2. KLASYFIKACJA GIER ZE WZGLĘDU NA INFORMACYJNĄ REPREZENTACJĘ GRACZY 31 Kwestie te zostają zawarte w pojęciu typu gracza. Harsanyi zakłada natomiast, że dany gracz zna swoją macierz wypłat oraz, że gracze wykonują ruchy jednocześnie. Naturalnym dopełnieniem podejścia Harsanyi do gier z niepełną informacją będą więc następujące przypadki: • Dany gracz nie zna swojego typu i nie zna typu innych graczy; • Dany gracz nie zna swojego typu i zna typ innych graczy; Podejcie Harsanyi i przyjęte przez niego założenie znajomości własnego typu i nieznajomości typu innych graczy powodowało przekształcenie oryginalnej gry z niepełną informacją w grę z pełną informacją, jednakże z inną niż w pierwotnej grze, semi-warunkową funcją użyteczności. Należy się więc spodziewać, że wyżej wymienine dwa uzupełnijące przypadki różnić się będą od pierwotnego jedynie postacią tych funkcji. Sam zaś model gry pozostanie niezmienny, jak również niezmiennym pozostanie sposób jej rozwiązania (poszukiwanie równowagi Nasha). Powyższe dwa przypadki należy więc jeszcze uzupełnić o przypadek sekwencyjnej kolejności ruchów, jak również o przypadek gry powtarzalnej3 . Oba te przypadki różnić się będą od przyjętego przez Harsanyi sposobem ich rozwiązywania (nie będzie to już poszukiwanie równowagi Nasha), sama zaś struktrura gry wynikać będzie z właściwej dla posiadanych informacji o typach graczy postaci funkcji użyteczności (normalnej lub semi-warunkowej). Szczegółowo mowa jest o tym w rozdziale 3 W swoje pracy Harsanyi zakłada rozgrywanie gry jednorazowej. 32 ROZDZIAŁ 3. MODELOWE UJĘCIE OGRANICZEŃ INFORMACYJNYCH W GRZE RYNKOWEJ Rozdział 4 Gry z niepełną informacją w ujęciu J. C. Harsanyi 4.1 Wprowadzenie Niniejszy rozdział został opracowany na bazie prac [28, 29, 62, 63]. 4.1.1 Teoria gier i klasyczna ekonomia Teoria gier to teoria strategicznych interakcji. Innymi słowy, jest to teoria racjonalnego zachowania w sytuacjach społecznych, w których każdy z graczy musi wybrać własny ruch (własną strategię) w oparciu o przypuszczenia odnośnie potencjalnego ruchu pozostałych graczy. Teoria gier, jako systematyczna teoria datuje swój początek na rok 1944, kiedy to von Neumann i Morgenstern publikują Theory of Games and Economic Behavior. Jednym z głównych obszarów zainteresowania nowej teorii była refleksja nad grami strategicznymi typu szachy czy poker. Jednakże twierdzenia wyprowadzone na bazie tych gier okazały się definiować również racjonalne zachowania w realnych sytuacjach ekonomicznych, politycznych i społecznych. W zasadzie każda sytuacja społeczna wywołuje strategiczne interakcje pomiędzy jej uczestnikami. Stąd można by argumentować, że do właściwego zrozumienia jakiejkolwiek sytuacji społecznej koniecznym jest przeprowadzenie analizy z użyciem narzędzi teorii gier. Jednakże teoria klasycznej ekonomii zdaje się omijać aspekty charakterystyczne dla teorii gier w analizie zagadnień ekonomicznych zachowań poprzez postulat konkurencji doskonałej, tj. założenia, że każdy nabywca i każdy sprzedawca jest bardzo mały, w porównaniu z rozmiarem całego rynku i w ten sposób żaden z uczestników rynku nie może swoimi decyzjami znacząco wpłynąć na aktualne ceny rynkowe. Zgodnie z tym, dla każdego podmiotu biorącego udział w grze rynkowej, ceny, za które może nabywać lub sprzedawać produkty są dane, z góry – przez mechanizm rynkowy 33 34 ROZDZIAŁ 4. GRY Z NIEPEŁNĄ INFORMACJĄ W UJĘCIU J. C. HARSANYI – ustalone. To założenie przekształca jego problem decyzyjny odnośnie wielkości nabywanych i sprzedawanych produktów w jedno-osobowy prosty problem maksymalizacji, który rozwiązać można z pominięciem analizy właściwej dla teorii-gier. Jednakże von Neumann i Morgenstern uświadomili sobie, że dla większości systemów ekonomicznych, założenie istnienia doskonałej konkurencji jest nierealistyczne. Większość przemysłów bowiem jest zdominowana przez małą liczbę dużych firm, a pracownicy organizują się w różnego rodzaju związki zawodowe. Co więcej administracja centralna i wiele innych agencji rządowych na wielu rynkach odgrywa rolę istotnych graczy jako potencjalni nabywcy a czasem i sprzedawcy, jako regulatorzy czy podmioty ustanawiające wysokość podatków czy subsydiów. To sprawia, że teoria gier stała się definitywnie istotnym narzędziem rozumienia i funkcjonowania w obecnych systemach ekonomicznych. 4.1.2 Problem niekompletnej informacji Podążając za von Neumann’em i Morgenstern’em wyróżnić możemy dwa rodzaje gier: • Gry z pełną informacją (complete information), które nazywać będziemy C-grami (Cgames); • Gry z niepełną informacją (incomplete information), które nazywać będziemy I-grami (Igames). Druga z gier różni się od pierwszej tym, że gracze, lub co najmniej część z nich nie posiada pełnej informacji na temat podstawowej struktury matematycznej, zdefiniowanej czy to postaci normalnej, czy ekstensywnej. Jednakże choć von Neumann i Morgenstern uczynili rozróżnienie pomiędzy C-grą i I-grą, ich teoria (i praktycznie wszystkie prace w zakresie teorii gier do 1960 roku) była ograniczona do analizy C-gier. Brak informacji na temat matematycznej struktury gry może przybierać różne formy. Gracze mogą nie posiadać pełnej informacji na temat funkcji wypłaty innych graczy (a nawet własnej), na temat fizycznych i społecznych zasobów, na temat strategii dostępnych innym graczom (w tym również sobie), na temat informacji posiadanych przez innych graczy odnośnie różnych aspektów gry itd. Jednakże, poprzez właściwe modelowanie, wszystkie formy niepełnej informacji mogą zostać zredukowane do przypadku, kiedy to gracze nie posiadają pełnej informacji na temat funkcji wypłaty – Ui każdego z graczy1 , definiującej wypłaty (utility payoff ) ui = Ui (s) każdego z graczy 1 W niniejszym rozdziale przyjmujemy konwencje zapisu stosowaną w oryginale przez J.C. Harsanyi, w szczegól- ności w wykładzie z okazji przyznania mu nagrody Nobla [29]. 4.2. DWU-OSOBOWA I-GRA 35 i dla każdej możliwej kombinacji strategii s = (s1 , . . . , sn ), wybranej przez n graczy biorących udział w grze. 4.2 4.2.1 Dwu-osobowa I-gra Model bazujący na przypuszczeniach coraz wyższego rzędu Rozważmy dwu-osobową I-grę G, w której gracze nie znają nawzajem własnych funkcji wypłaty. (Dla uproszczenia zakładamy jednak, że gracze znają własne funkcje wypłaty). Bardzo naturalnym – jednakże, jak to wkrótce się okaże raczej niepraktycznym – sposobem analizowania tego typu gry może być następujący sposób rozumowania: gracz 1 uświadamia sobie, że strategia s2 gracza 2 będzie zależna od jego własnej (gracza 2) funkcji wypłaty U2 . Dlatego też zanim zdecyduje się na wybór swojej własnej strategii s1 , gracz 1 tworzy pewne przypuszczenie e1 U2 odnośnie natury funkcji wypłaty U2 gracza 2. Na tej samej zasadzie, gracz 2 formułuje pewne przypuszczenie e2 U1 odnośnie natury funkcji wypłaty U1 gracza 1. Te dwa przypuszczenia e1 U2 oraz e2 U 1 nazwiemy przypuszczeniami pierwszego rzędu. Następnie gracz 1 tworzy przypuszczenie drugiego rzędu e1 e2 U 1 odnośnie przypuszczenia pierwszego rzędu e2 U1 gracza 1, natomiast gracz A tworzy przypuszczenie drugiego rzędu e2 e1 U2 odnośnie przypuszczenia pierwszego rzędu e1 U2 gracza 1 itd. Oczywiście jeśli obaj gracze chcą kontynuować to Bayesowskie podejście wówczas ich przypuszczenia przybiorą formę subiektywnego rozkładu prawdopodobieństwa na odpowiednich obiektach matematycznych. W ten sposób, przypuszczenie pierwszego rzędu e1 U2 gracza 1 przybierze formę subiektywnego rozkładu prawdopodobieństwa P11 (U2 ) na wszystkich możliwych postaciach funkcji U2 , które gracz 2 może posiadać. Podobnie, przypuszczenie pierwszego-rzędu e2 U1 gracza 2 przyjmie postać subiektywnego rozkładu prawdopodobieństwa P21 (U1 ) na wszystkich możliwych postaciach funkcji U1 , którą gracz 1 może posiadać. Z drugiej strony przypuszczenie drugiego rzędu e1 e2 U1 gracza 1 przyjmie formę subiektywnego rozkładu prawdopodobieństwa P12 (P21 ) na wszystkich możliwych rozkładach prawdopodobieństwa P21 jakie może przyjąć gracz 2. Ujmując rzecz bardziej ogólnie, przypuszczenie k-tego rzędu (k > 1), któregokolwiek z graczy i będzie subiektywnym rozkładem prawdopodobieństwa Pik (Pjk−1 ) na wszystkich przypuszczeniach (k-1)-go rzędu Pjk−1 , które drugi gracz j (j 6= i) mógłby przyjąć. Oczywiście jakikolwiek model, bazujący na przypuszczeniach coraz wyższego rzędu, będzie komplikował się jeszcze bardziej, jeśli graczy będzie więcej niż dwóch (n-osobowa I-gra). Nawet jeśli zachowamy upraszczające założenie, że każdy z graczy zna swoją własną funkcję wypłaty, to i tak każdy z graczy będzie musiał sformułować (n − 1) różnych przypuszczeń pierwszego 36 ROZDZIAŁ 4. GRY Z NIEPEŁNĄ INFORMACJĄ W UJĘCIU J. C. HARSANYI rzędu, (n − 1)2 przypuszczeń drugiego rzędu i tak dalej. Istnieje jednakże znacznie prostsze i bardziej właściwe podejście do analizy I-gier, oparte jedynie na jednym rozkładzie prawdopodobieństwa P r (w połączeniu z n różnymi rozkładami prawdopodobieństw warunkowych, z których każde otrzymuje się na podstawie rozkładu P r). 4.2.2 Negocjacje pomiędzy Stanami Zjednoczonymi a Związkiem Radzieckim, odnośnie kontroli zbrojeń W latach 1965-69 J.C. Harsanyi, wraz z grupą około 10 specjalistów od teorii gier został zatrudniony przez Agencję Kontroli Zbrojeń i Rozbrojenia w Stanach Zjednoczonych, jako konsultant w procesie redukcji zbrojeń i związanych z tym negocjacji pomiędzy USA i Związkiem Radzieckim. Istotnym problemem w tych negocjacjach był fakt, że każda ze stron była względnie dobrze poinformowana odnośnie swojej własnej sytuacji, z uwzględnieniem różnych zmiennych związanych z tymi negocjacjami, takimi jak cele polityki, nasycenie postawą pokojową lub wojowniczą względem drugiej strony negocjacji, siła militarna, zdolność to wprowadzenia nowych technologii militarnych itd. – a zarazem raczej słabo poinformowana odnośnie sytuacji drugiej strony, w szczególności charakterystyki tych zmiennych. Odnalezienie właściwej reprezentacji matematycznej tego szczególnego problemu, było krytycznym kluczem do stworzenia lepszej teorii negocjacji dotyczącej kontroli zbrojeń jak również lepszej teorii dotyczącej I-gier2 . Podejście J.C. Harsanyi do rozwiązania tego problemu było następujące. Strona amerykańska oznaczona została jako gracz 1, strona radziecka jako gracz 2. Dla zamodelowania niepewności gracza rosyjskiego odnośnie prawdziwej natury gracza amerykańskiego, tj. gracza 1, Harsanyi założył istnienie K różnych możliwych typów gracza 1, oznaczonych odpowiednio: t11 , t21 , . . . , tk1 , . . . , tK 1 . Gracz rosyjski, tj. gracz 2 nie wie, który z poszczególnych typów gracza 1 aktualnie reprezentuje stronę amerykańską w grze. Ten fakt (niewiedza odnośnie aktualnego typu gracza amerykańskiego, gracza 1) stanowi dla gracza rosyjskiego istotny problem z tego powodu, że jego własne strategiczne możliwości w danej grze w oczywisty sposób zależą, często nawet bardzo mocno, od tego, przeciwko któremu z poszczególnych typów gracza amerykańskiego przychodzi mu grać w tej grze. Każdemu z K możliwych typów gracza amerykańskiego może odpowiadać radykalnie inna kombinacja możliwych charakterystyk tego gracza, w tym charakterystyka jego intencji, zdolności lub niezdolności do wdrożenia nowych technologii militarnych, które w szczególnych przypadkach 2 Podobne problemy występują również w konkurencyjnych działaniach o charakterze ekonomicznym, jak również w wielu innych działaniach o charakterze społecznym. Dla przykładu firmy biznesowe niemalże zawsze są lepiej poinformowane odnośnie wartości zmiennych ekonomicznych związanych z ich własną działalnością niż z działalnością konkurentów. 4.2. DWU-OSOBOWA I-GRA 37 mogą radykalnie różnić się od przewidywanych przez stronę rosyjską. Co więcej, różne typy gracza Amerykańskiego mogą się różnić pomiędzy sobą w zakresie przewidywań (przypuszczeń) odnośnie prawdziwej natury gracza rosyjskiego. Analogicznie, dla zamodelowania niepewności gracza amerykańskiego odnośnie prawdziwej natury gracza rosyjskiego, tj. gracza 2, Harsanyi zakłada istnienie M różnych możliwych typów M gracza 2: t12 , t22 , . . . , tm 2 , . . . , t2 . Gracz amerykański, tj. gracz 1, nie wie który z poszczególnych typów gracza 2 aktualnie reprezentuje stronę rosyjską w grze. Ten fakt stanowi dla gracza amerykańskiego istotny problem, ponieważ każdy z M możliwych typów gracza rosyjskiego może określać bardzo różne kombinacje możliwych charakterystyk gracza rosyjskiego. Co więcej, różne typy gracza rosyjskiego mogą różnić się między sobą w zakresie przewidywań (przypuszczeń) odnośnie prawdziwej natury gracza amerykańskiego. 4.2.3 Interpretacja I-gier skupiona na typach graczy C-gry, tj. gry z pełną informacją są zawsze analizowane z założeniem, że centrum aktywności w grze są biorący w niej udział gracze. W przypadku I-gier, tj. gier z niepełną informacją istnieje swoboda wyboru pomiędzy dwoma alternatywnymi podejściami. Jedno z podejść zakłada, że centrum aktywności są gracze, jak to miało miejsce w C-grach. Drugie zakłada, że centrum aktywności stanowią różne typy tych graczy. Pierwsze z podejść Harsanyi określa jako interpretację skupioną na graczach (player-centered interpretation), drugie jako interpretację skupioną na typach (type-centered interpretation). Jeśli tylko obie interpretacje użyte są poprawnie to są one zawsze ekwiwalentne z punktu widzenia teorii gier. Jednakże, zdaniem Harsanyi interpretacja skupioną na typach dostarcza bardziej wygodnego języka do analizy I-gier3 . Przy założeniu interpretacji skupionej na typach, w przypadku gdy gracz 1 jest typu tk1 , wówczas strategie i wypłaty gracza 1 są opisywane jako strategie i wypłaty tego typu tk1 gracza 1. Ten język posiada tę zaletę, że umożliwia formułowanie stwierdzeń odnośnie typu tk1 , bez konieczności czynienia dalszych kwalifikacji, podczas gdy analogiczne stwierdzenia odnośnie gracza 1 wymagałoby dodatkowego tłumaczenia, że to stwierdzenie dotyczy go wówczas, gdy jest on typu tk1 . Stosowanie tego języka czyni zarazem użyteczne przypomnienie, że w dowolnej I-grze strategia, którą dany gracz stosuje i wypłata jaką otrzymuje, zależy od tego, jakiego jest on typu. Oczywiście należy pamiętać, że jakiekolwiek stwierdzenie dotyczące danego typu tk1 , może zawsze być przetłumaczone na język podejścia skupionego na graczach, poprzez założenie, że dotyczy ono gracza 1 wówczas, gdy jest on typu tk1 . W analogiczny sposób można definiować język skupiony na typach odnośnie gracza 2, gdy 3 W swoich pierwszych pracach na ten temat, opublikowanych w latach 1967-68 Harsanyi stosował podejście skupione na graczach (player-centered ). 38 ROZDZIAŁ 4. GRY Z NIEPEŁNĄ INFORMACJĄ W UJĘCIU J. C. HARSANYI jest on typu tm 2 . 4.2.4 Dwa aktywne typy i ich funkcje wypłaty Załóżmy, że gracz 1 jest typu tk1 , natomiast gracz 2 jest typu tm 2 . Przy takim założeniu możemy powiedzieć, że ci dwaj gracze są reprezentowani przez swoje typy tk1 i tm 2 oraz, że są to typy 0 0 aktywne w grze. Dla odmiany, wszystkie typy tk1 takie, że k 0 6= k i wszystkie typy tm 2 takie, że m0 6= m będziemy nazywali typami nieaktywnymi. W dwuosobowych C-grach, wypłaty któregokolwiek z graczy zależą jedynie od strategii wybranych przez każdego z graczy. Dla odmiany, w dwuosobowych I-grach wypłaty v1k i v2m k m dwóch aktywnych typów tk1 i tm 2 zależą nie tylko od strategii s1 i s2 (czystych lub mieszanych) wybranych przez te typy, ale również od ich typów, jak na to wskazują indeksy górne k i m w k m symbolach tk1 i tm 2 oznaczających te je. Stąd wypłaty v1 i v2 zdefiniować można w następujący sposób: v1k = V1k (sk1 , sm 2 ; k, m) (4.1) v2m = V2m (sk1 , sm 2 ; k, m) (4.2) gdzie V1k i V2m oznacza funkcje wypłaty odpowiednio typu tk1 i tm 2 . Harsanyi nazywa funkcje V1k i V2m warunkowymi funkcjami wypłaty z tego względu, że wypłata typy tk1 przyjmie wartość v1k zdefiniowaną zależnością 4.1 jedynie wówczas, gdy tk1 jest aktywnym typem w grze, a drugim aktywnym typem w tej grze jest tm 2 . Podobnie, wypłata typu m m tm 2 przyjmie wartość v2 , zdefiniowaną zależnością 4.2 jedynie wówczas, gdy t2 jest aktywnym typem w grze i drugim aktywnym typem jest tk1 . Ściślej mówiąc, jeśli którykolwiek z typów tk1 lub tm 2 byłby nieaktywnym typem, wówczas nie byłby on uczestnikiem tej gry i stąd, nie otrzymywałby żadnej wypłaty (lub otrzymywałby wypłatę równą zero). 4.2.5 Zakres posiadanej wiedzy w grze Dla wygody, Harsanyi zakłada, że matematyczna forma obu funkcji wypłat V1k i V2m są znane każdemu z uczestników gry. Innymi słowy, funkcje te są znane każdemu graczowi i każdemu z typów tych dwóch graczy. Harsanyi zakłada również, że gracz 1 wie który z typów tk1 reprezentuje go w grze. Podobnie, gracz 2 wie przez którego z typów tm 2 jest reprezentowany. Jednakże, w celu zamodelowania niepewności każdego z graczy odnośnie prawdziwej natury drugiego gracza, Harsanyi zakłada, że żaden z graczy nie wie przez który z typów reprezentowany jest drugi gracz. 4.2. DWU-OSOBOWA I-GRA 39 W języku skupionym na typach, te założenia oznaczają, że każdy z typów obu graczy wie, że jest aktywny, jeśli w rzeczywistości jest. Co więcej, typy te potrafią się zidentyfikować (dla przykładu typ t31 wie, że jest typem t31 itd.). Dla odmiany, żaden z typów gracza 1 nie wie, który z typów gracza 2 jest aktywny (i nie potrafi go zidentyfikować), jak też żaden z typów gracza 2 nie wie, który z typów gracza 1 jest aktywny. 4.2.6 Dwa istotne rozróżnienia Jak już to można było zauważyć, istnieje jedna istotna różnica pomiędzy grami z pełną (complete) i grami z niepełną (incomplete) informacją, tj. pomiędzy C-grami i I-grami. Różnica ta dotyczy ilości informacji posiadanej przez graczy odnośnie podstawowej struktury matematycznej gry (czy to w jej postaci normalnej czy ekstensywnej). Innymi słowy, różnica dotyczy ilości posiadanej informacji, którą gracze posiadają przed rozpoczęciem gry. W C-grach wszyscy gracze posiadają pełną informację na temat podstawowej struktury matematycznej gry, która tę grę definiuje. Dla odmiany w I-grach, wszyscy gracze lub conajmniej kilku z nich posiada jedynie informację częściową. Inna, z pozoru podobna, choć jednakże zupełnie inna różnica zachodzi pomiędzy grami z grami z doskonałą (perfect) i niedoskonałą (imperfect) informacją. To rozróżnienie bazuje na ilości informacji, jaką gracze posiadają odnośnie sposobu rozgrywania gry – odnośnie ruchów (moves), które zostały wykonane – we wcześniejszych fazach rozgrywania gry, tj. odnośnie pewnych zdarzeń, które zaszły w trakcie rozgrywania gry, nie zaś przed jej rozpoczęciem. W grach z doskonałą informacją, wszyscy gracze posiadają pełną informację na temat wydarzeń (ruchów) z każdego z wcześniejszych etapów rozgrywania gry. Dla odmiany, w grach z niedoskonałą informacją, gracze (wszyscy lub niektórzy) posiadają jedynie jedynie częściową lub żadną informację odnośnie wcześniejszych etapów gry. W tym sensie szachy i warcaby zaklasyfikować można do gier z doskonałą informacją, z tej racji, że umożliwiają graczom obserwację nie tylko własnych ruchów, ale również ruchów drugiego gracza. Dla odmiany, większość gier z użyciem kart należy do gier z niedoskonałą informacją, ponieważ gry te nie umożliwiają graczom obserwacji kart jakie otrzymują inni gracze, lub jakich się pozbywają, jeśli odkładają je w sposób utajniony. Teoria gier, od czasu von Neumann’a i Morgenstern’a, aż do późnych lat 60-tych XX wieku zajmowała się głównie grami z pełną (complete) informacją, klasyfikując wszystkie rozpatrywane gry do jednej grupy niezależnie od tego, czy były to gry z doskonałą czy niedoskonałą informacją. 40 ROZDZIAŁ 4. GRY Z NIEPEŁNĄ INFORMACJĄ W UJĘCIU J. C. HARSANYI 4.2.7 Model probabilistyczny I-gry G Do tego momentu rozważaliśmy aktualne typy obu graczy, reprezentowane przez aktywną parę (tk1 , tm 2 ) po prostu jako daną. Aktualnie wzbogacimy nasz model gry poprzez dodanie pewnych formalnych współczynników odzwierciedlających przyczynę, że gracz amerykański i rosyjski posiadają charakterystykę opisaną przez (powiedzmy) typy tk1 i tm 2 . Przyczyny te, w tym konkretnym przypadku odzwierciedlają oddziaływanie różnych sił społecznych, zlokalizowanych w Stanach Zjednoczonych i Związku Radzieckim, jak również przypuszczalnie w innych częściach świata. Ddoświadczenie pokazuje, że skutki działania nawet dokładnie określonych sił społecznych można przewidywać jedynie z pewnym prawdopodobieństwem. Dlatego też Harsanyi wprowadza losowy mechanizm, a ściślej mówiąc loterię, dla wyrażenia w sposób formalny skutku działania określonych sił społecznych, które doprowadzają do tego, że strona tak strona amerykańska jak i rosyjska jest reprezentowana w grze przez określony typ: odpowiednio tk1 i tm 2 . Precyzyjniej mówiąc, Harsanyi zakłada, że zanim jeszcze jakikolwiek ruch zostanie wykonany w grze G, pewna loteria L wybiera tk1 jako typ reprezentujący gracza amerykańskiego i tm 2 , jako typ reprezentujący gracza rosyjskiego. Harsanyi zakłada przy tym, że znane jest prawdopodobieństwo wyboru określonej pary typów (tk1 , tm 2 ): P r(tk1 , tm 2 ) = pkm k = 1, . . . , K; m = 1, . . . , M. (4.3) Jako, że gracz 1 posiada K różnych możliwych typów, a gracz 2 – M różnych typów, to loteria L posiada wybór pomiędzy H = K · M różnymi parami postaci (tk1 , tm 2 ). Stąd też, dla scharakteryzowania tej loterii potrzeba H różnych prawdopodobieństw pkm . Oczywiście, każde z H prawdopodobieństw przyjmuje wartość od 0 do 1, a wszystkie sumują się do jedności. Co więcej tworzą one swoistą macierz prawdopodobieństw [pkm ] o wymiarach K × M , taką, że dla każdej możliwej wartości k i m, k-ty wiersz koresponduje z typem tk1 gracza 1, a m-ta kolumna koresponduje z typem tm 2 gracza 2. Harsanyi zakłada, że każdy z graczy stara się dokonać estymacji tych H prawdopodobieństw, w oparciu o posiadaną informację na temat odpowiednich sił społecznych, używając do tego jedynie informację dostępną dla każdej ze stron. W istocie, gracze mogą estymować te prawdopodobieństwa w sposób w jaki czyniłby to zewnętrzny obserwator, posiadający iformację wspólną dla obu graczy. Co więcej, Harsanyi zakłada, że każdy z graczy zakłada, że drugi z graczy estymuje te prawdopodobieństwa pkm w ten sam sposób co on (tzw. common priors assumption). Alternatywnie założyć po prostu można, że obaj gracze przyjmują, że każdy z graczy zna prawdziwą numeryczną wartość tych prawdopodobieństw pkm . Matematyczny model gry, który otrzymaliśmy po dodaniu loterii L do dwuosobowej I-gry, 4.2. DWU-OSOBOWA I-GRA 41 Harsanyi nazywa modelem probabilistycznym tej I-gry G. Jak to za chwilę zobaczymy, ten probabilistyczny model przekształca tę I-grę G w C-grę, czyli grę z pełną informacją, którą nazwiemy grą G∗ . 4.2.8 Przekształcenie I-gry G z niepełną (incomplete) informacją w grę G∗ z pełną (complete) ale niedoskonałą (imperfect) informacją W tym punkcie posługiwali będziemy się językiem skupionym na graczach (player-centered ) z tej racji, że w tym języku wyrażone są tradycyjne sformułowania dla gier z pełną i niepełną, jak też doskonałą i niedoskonałą informacją. Powróćmy do dwu-osobowej gry G, użytej przez nas jako model negocjacji odnośnie redukcji zbrojeń pomiędzy Stanami Zjednoczonymi a Związkiem Radzieckim. Teraz możemy lepiej zrozumieć dlaczego, przy naszych pierwotnych założeniach odnośnie gry G, dlaczego jest to gra z niepełną informacją. (i) Przede wszystkim, zgodnie z naszymi pierwotnymi założeniami, gracz 1 jest typu tk1 , co możemy określić jako Fakt I, podczas gdy gracz 2 jest typu tm 2 , co określimy jako Fakt II. Co więcej, zarówno Fakt I jak i Fakt II, zaistniały na samym początku gry i nie wynikają z jakichkolwiek ruchów wykonanych w trakcie rozgrywania gry. W konsekwencji, oba fakty muszą być rozważane jako części składowe podstawowej struktury matematycznej tej gry G. (ii) Z drugiej strony, zgodnie z przyjętym wcześniej założeniem, gracz 1 zna Fakt I, ale nie wie nic na temat Faktu II. Analogicznie, gracz 2 zna Fakt II, jednakże nic nie wie na temat Faktu I. Ponieważ zarówno Fakt I jak i Fakt II należą do podstawowej matematycznej struktury gry, dlatego też ani gracz 1 ani gracz 2 nie posiada pełnej informacji na temat tej struktury i dlatego gra G jest grą z niepełną informacją. Teraz pokażemy, że reinterpretacja gry G zgodnie z wprowadzonym wcześniej modelem probabilistycznym (poprzez dodanie loterii L do gry G), przekształca tę grę w nową grę G∗ , która jest grą z pełną informacją. Oczywiście, nawet po tej reinterpretacji, stwierdzenie zawarte w punkcie (ii) pozostanie prawdziwe. Jednakże status Faktu I i Faktu II, jak to sformułowano w punkcie (i) ulegnie radykalnej zmianie. Oba fakty staną się teraz rezultatami losowego wyboru dokonanego przez loterię L w trakcie rozgrywania gry i dlatego nie będą już stanowić części matematycznej struktury gry. W konsekwencji założenie, że żaden z graczy nie zna obu tych Faktów, nie czyni już tej nowej gry G∗ grą z niepełną informacją. Wręcz przeciwnie, nowa gra G∗ będzie grą z pełną informacją z tego powodu, że jego matematyczna struktura zdefiniowana jest przez model probabilistyczny, który jest dobrze i w pełni znany każdemu z graczy. Z kolei, prawdziwość stwierdzenia (ii) odnośnie naszej nowej gry G∗ , wyraża się w tym, że 42 ROZDZIAŁ 4. GRY Z NIEPEŁNĄ INFORMACJĄ W UJĘCIU J. C. HARSANYI każdy z graczy posiada jedynie częściową informację odnośnie pary (tk1 , tm 2 ), będącej rezultatem losowego wyboru dokonanego przez loterię L na samym początku gry. Wybór dokonany przez loterię L należy więc do historii rozgrywanej gry G∗ (nie zaś do jej podstawowej matematycznej struktury, która jest niezmienna w trakcie rozgrywania gry), a więc z racji na niepełną informację o tej historii wypada nam ją określić jako grę z niedoskonałą (imperfect) informacją. Dlatego też gra G∗ jest grą z pełną (complete) ale niedoskonałą (imperfect) informacją. 4.2.9 Warunkowe prawdopodobieństwa w grze G∗ Przypuśćmy, że loteria L wybrała tk1 jako reprezentanta gracza 1 w grze. Stąd, zgodnie z poczynionymi wcześniej założeniami, typ tk1 wie, że jest typem aktywnym i wie, że jest typem tk1 . Jednakże typ ten nie wie jaki inny typ (drugiego gracza) jest aktywny w tej grze. W jaki sposób typ tk1 może teraz określić prawdopodobieństwo, że drugim aktywnym typem w grze jest teraz typ tm 2 gracza 2? Może i musi tego dokonać w oparciu o informacje, które posiada, tzn. w oparciu o informację, że on, typ tk1 jest typem aktywnym. Oznacza to, że musi on określić poszukiwane prawdopodobieństwo, jako prawdopodobieństwo warunkowe: pkm k . π1k (m) = P r(tm 2 |t1 ) = PK k=1 pkm (4.4) Załóżmy teraz, że loteria L wybrała typ tm 2 jako reprezentanta gracza 2 w rozpatrywanej grze. W jaki sposób teraz typ tm 2 może określić prawdopodobieństwo, że drugim aktywnym typem jest typ tk1 gracza 1? Analogicznie rozumując, winien określić to prawdopodobieństwo jako prawdopodobieństwo warunkowe: pkm . π2m (k) = P r(tk1 |tm 2 ) = PM m=1 pkm 4.2.10 (4.5) Semi-warunkowa funkcja wypłaty dwu aktywnych typów w grze Załóżmy, że aktywne są w grze dwa typy tk1 i tm 2 . Jak była o tym wcześniej mowa wartości wypłat v1k i v2m tych dwóch aktywnych typów zdefiniwane są przez zależności (4.1 i) i (4.2). Warto zauważyć, jednakże, że wypłata v1k zdefiniowane zależnością (4.1) nie jest tą wartością, którą typ tk1 stara się zmaksymalizować wybierając strategię sk1 . Wynika to z faktu, że typ tk1 k nie wie, że jego aktualnym kontrpartnerem w grze jest typ tm 2 . Typ t1 wie jedynie, że jego kontrpartnerem w grze będzie jeden z M typów gracza 2. Dlatego też, typ tk1 będzie wybierał strategię sk1 w celu zabezpieczenia swoich interesów nie w odniesieniu tylko do swojego nieznanego sobie aktualnego kontrpartnera tm 2 ale raczej w odniesieniu do wszystkich M typów gracz 2, ponieważ wszystko, co typ tk1 wie, to to, że każdy z nich może aktualnie być his kontrpartnerem w grze. 43 4.2. DWU-OSOBOWA I-GRA Jednakże typ tk1 wie, że prawdopodobieństwo, że drugim aktywnym typem w grze jest typ tm 2 równe jest warunkowemu prawdopodobieństwu π1k (m) zdefiniowanego zależnością (4.4). Stąd też wielkością, którą typ tk1 będzie starał się zmaksymalizować jest wartość oczekiwana uk1 wypłaty v1k , którą wyrazić można w sposób następujący: M X uk1 = U1k (sk1 , s∗2 ) = π1k (m) · V1k (sk1 , sm 2 ; k, m). (4.6) m=1 Symbol s∗2 oznacza tu wektor M strategii: M s∗2 = (s12 , s22 , . . . , sm 2 , . . . , s2 ). (4.7) Symbol s∗2 został wprowadzony, jako drugi argument funkcji U1k w celu pokazania, że wartość oczekiwana wypłaty uk1 typu tk1 zależy nie tylko od strategii sm 2 , którą jego aktualny i nieznany 1 M mu kontrpartner tm 2 stosuje, ale raczej od zbioru (wektora) strategii s2 , . . . , s2 , które dowolny z jego M potencjalnych kontrpartnerów t12 , . . . , tM 2 mógłby zastosować w sytuacji, gdyby został wybrany przez loterię L jako kontrpartner typy tk1 w rozpatrywanej grze. Analogiczne rozumując wielkością, którą typ tm 2 będzie chciał maksymalizować, wybierając m swoją strategię sm 2 , nie będzie jego wypłata v2 zdefiniowana zależnością (4.2), lecz raczej będzie m nią wartość oczekiwana um 2 tej wypłaty v2 , zdefiniowana zależnością: m ∗ m um 2 = U2 (s1 , s2 ) = K X π2m (k) · V2m (sk1 , sm 2 ; k, m). (4.8) k=1 Symbol s∗1 oznacza tu wektor K strategii: s∗1 = (s11 , s21 , . . . , sk1 , . . . , sK 1 ). (4.9) I w tym miejscu, symbol s∗1 został wprowadzony jako pierwszy argument funkcji U2m w celu 1 K wskazania, że wartość oczekiwana wypłaty typu tm 2 zależy od wszystkich K strategii s1 , . . . , s1 , którą każdy z K typów gracza 1 mógłby wybrać w przypadku, gdyby był wybrany przez loterię L jako kontrpartner typu tm 2 w rozpatrywanej grze. Dla odróżnienia od warunkowych funkcji wypłaty V1k i V2m , użytych w zależnościach (4.1) i (4.2), funkcje wypłaty U1k i U2m użyte w zależnościach (4.6) i (4.8) Harsanyi określa jako semiwarunkowe (semi-conditional ). Funkcje V1k i V2m definiują wypłaty v1k lub v2m odpowiedniego typu jako zależne od dwóch warunków : (a) Dany typ musi mieć status typu aktywnego i (b) Drugi aktywny typ w grze musi być określonym typem drugiego gracza. 44 ROZDZIAŁ 4. GRY Z NIEPEŁNĄ INFORMACJĄ W UJĘCIU J. C. HARSANYI Dla odmiany, funkcje U1k i U2m definiują wartość oczekiwaną wypłaty uk1 i um 2 odpowiedniego typu jako niezależne od warunku (b) a zarazem zależne od warunku (a). Wynika to stąd, że żaden z typów nie otrzyma wypłaty w ogóle, jeśli nie został wybrany przez loterię L jako typ aktywny w grze. Jak o tym była już wcześniej mowa, reinterpretacja oryginalnej I-gry G poprzez wprowadzenie dla niej modelu probabilistycznego, doprowadziło do tego, że I-gra G stała się w istocie C-grą, którą oznaczyliśmy jako G∗ . Zgodnie z interpretacją skupioną na typach (type-center interpretation), ta C-gra G∗ może być rozpatrywana jako (K+M)-osobowa gra, w której rzeczywistymi „graczami” będą K typów gracza 1 i M typów gracza 2, z ich podstawowymi funkcjami wypłaty będącymi semi-warunkowymi funkcjami wypłaty U1k (k = 1, . . . , K) i U2m (m = 1, . . . , M ). Jeśli będziemy rozpatrywali te (K+M) typów jako rzeczywistych „graczy” w grze G∗ oraz funkcje wypłaty U1k i U2m jako ich rzeczywiste funkcje wypłaty, wówczas w sposób prosty możemy określić równowagę Nash’a w tej C-grze G∗ . Wówczas, stosując odpowiednią teorię wyboru równowag, możemy określić jedną z nich jako rozwiązanie tej gry. 4.3 4.3.1 N-osobowa I-gra Typy różnych graczy, aktywny zbiór, i właściwe zbiory w n-osobowej I-grze Analiza dwu-osobowych I-gier może być w sposób prosty rozszerzona do n-osobowych I-gier. Ograniczymy się jednakże w tym miejscu jedynie do najważniejszych kwestii związanych z grami n-osobowymi. Załóżmy, że N oznacza zbiór wszystkich n graczy. Załóżmy, że każdy gracz i (i = 1, . . . , n) i posiada Ki różnych możliwych typów, które oznaczymy jako t1i , . . . , tki , . . . , tK i . Stąd całkowita liczba różnych typów w grze wynosi: Z= X Ki . (4.10) i∈N Załóżmy, że gracze 1, . . . , i, . . . , n są aktualnie reprezentowani w grze przez swoje aktywne typy tk11 , . . . , tki i , . . . , tknn . Zbiór aktywnych n typów Harsanyi nazywa zbiorem aktywnym i oznacza jako ā. Jakikolwiek zbiór n typów zawierający dokładnie jeden typ każdego z n graczy może w zasadzie pełnić rolę zbioru aktywnego. Każdy taki zbiór nazwiemy zbiorem właściwym (appropriate set). Jako, że dowolny gracz i posiada Ki różnych typów, liczba różnych zbiorów właściwych w grze wynosi: H= Y i∈N Ki . (4.11) 45 4.3. N-OSOBOWA I-GRA Przyjmijmy, że tych H zbiorów właściwych zostanie ponumerowane i oznaczone jako: a1 , a2 , . . . , ah , . . . , aH . (4.12) Przyjmijmy, że Aki będzie rodziną wszystkich zbiorów właściwych zawierających w sobie jako członka konkretny typ tki pewnego gracza i. Liczba różnych zbiorów właściwych w rodzinie Aki wyniesie: Y a(i) = H . Ki Kj = j∈N,j6=i (4.13) Oznaczmy przez Bik zbiór wszystkich indeksów h takich, że ah należy do rodziny Aki . Ponieważ istnieje zależność jeden do jednego pomiędzy elementami zbioru Aki i elementami zbioru Bik stąd też, zbiór Bik posiada a(i) różnych elementów. 4.3.2 Niektóre prawdopodobieństwa Załóżmy, iż zanim jakikolwiek ruch zostanie wykonany w grze G∗ , pewna loteria L wybiera jeden szczególny zbiór właściwy a i czyni go zbiorem aktywnym ā w grze. Wszystkie n typów w tym zbiorze ā są typami aktywnymi, podczas gdy wszystkie pozostałe typy nie należące do zbioru aktywnego ā są typami nieaktywnymi. Przyjmijmy, że prawdopodobieństwo, że konkretny zbiór właściwy ah został wybrany przez loterię L jako zbiór aktywny ā w tej grze wynosi: P r(ā = ah ) = rh dla h = 1, . . . , H. (4.14) Oczywiście każde z tych H prawdopodobieństw rh jest nieujemne i wszystkie sumują się do jedności. Są to analogiczne prawdopodobieństwa, do prawdopodobieństw pkm (zdefiniowanych zależnością (4.3)), które wprowadzone zostały dla gier dwu-osobowych. Przypuśćmy, że pewien konkretny typy tki gracza i został wybrany przez loterię L jako aktywny typ w tej grze. Wówczas, zgodnie z uczynionymi założeniami, typ ten wie, że jest typem tki i wie, że jest typem aktywnym. Innymi słowy, tki wie, że: tki ∈ ā. (4.15) Ze stwierdzenia, że tki ∈ ā, czyli, że typ tki należy do zbioru aktywnego wynika stwierdzenie, że ten zbiór aktywny ā należy do rodziny zbiorów właściwych Aki zawierających ten typ. Stąd mamy: ā ∈ Aki (4.16) i odwrotnie, ponieważ Aki zawiera dokładnie te zbiory właściwe, których członkiem jest aktywny typ tki , to zachodzi również implikacja w drugą stronę. Stąd zapisać możemy: (tki ∈ ā) ⇐⇒ (ā ∈ Aki ). (4.17) 46 ROZDZIAŁ 4. GRY Z NIEPEŁNĄ INFORMACJĄ W UJĘCIU J. C. HARSANYI Powiedzieliśmy wcześniej, że jeśli tki jest typem aktywnym wówczas typ ten wie, że zachodzi (4.15). Teraz możemy dodać do tego jeszcze stwierdzenie, że typ ten wie, że zachodzi (4.16) i (4.17). W sposób prosty typ ten może obliczyć prawdopodobieństwo, że loteria L wybierze aktywny zbiór ā jako należący do rodziny Aki : P r(ā ∈ Aki ) = X rh . (4.18) h∈Bik W kontekście zależności od (4.15) do (4.18) można zapytać, w jaki sposób typ tki może określić prawdopodobieństwo, że aktywnym zbiorem ā wybranym przez loterię L jest aktualnie konkretny zbiór ah ? Odpowiedź jest prosta: jako prawdopodobieństwo warunkowe: πik (h) = P r(ā = ah |tki ∈ ā). (4.19) W kontekście zależności od (4.17) do (4.18) otrzymujemy: P r(ā = ah |tki ∈ ā) = P r(ā = ah |ā ∈ Aki ) = P r(ā = ah ) rh . =P k P r(ā ∈ Ai ) h∈B k rh (4.20) . (4.21) i W konsekwencji (4.19) i (4.20) otrzymamy zależność: πik (h) = P rh h∈Bik rh 4.3.3 Profile strategii Ki 1 k i Załóżmy, że Ki typów gracza i: t1i , . . . , tki , . . . , tK i wybrałoby strategie si , . . . , si , . . . , si (czyste lub mieszane) w przypadku, gdyby zostały wybrane przez loterię L jako aktywne typy w grze4 . Wprowadzimy zależność: i s∗i = (s1i , . . . , ski , , sK i ) dla i = 1, . . . , n (4.22) dla oznaczenia profilu strategii 5 Ki typów gracza i. Niech s∗ = (s∗i , . . . , s∗n ) (4.23) będzie uporządkowanym zbiorem, który otrzymujemy wówczas gdy zestawimy ze sobą w kolejności K1 strategii z profilu s∗1 , następnie K2 strategii z profilu s∗2 ,. . . , następnie Ki strategii z 4 Zgodnie z wcześniejszym założeniem, nieaktywne typy nie uczestniczą aktywnie w grze i stąd nie wybierają żadnej strategii gry. 5 W swoich oryginalnych pracach (lata 60te XX wieku) Harsanyi używa w tym miejscu pojęcia strategii znormalizowanej. Pojęcie profilu strategii pojawia się w późniejszym opracowaniu [29]. 47 4.3. N-OSOBOWA I-GRA profilu s∗i ,. . . i na koniec Kn strategii z profilu s∗n . Oczywiście, s∗ oznacza profil strategii wszystkich typów w rozpatrywanej grze. Korzystając z zależności (4.10), wyznaczającej całkowitą liczbę różnych typów w grze możemy powiedzieć, że profil s∗ zawiera Z różnych strategii. I na koniec oznaczmy przez s∗ (h) profil strategii n typów należących do konkretnego zbioru właściwego ah , gdzie h = 1, . . . , H. 4.3.4 Warunkowe funkcje wypłaty Niech ah będzie zbiorem właściwym zdefiniowanym w następujący sposób: ah = (tk11 , . . . , tki i , . . . , tknn ). (4.24) Wprowadzimy pojęcie wektora charakterystycznego c(h) dla zbioru ah , który będzie zbiorem (wektorem) indeksów typów ki poszczególnych graczy i, należących do zbioru właściwego ah : c(h) = (k1 , . . . , ki , . . . , kn ). (4.25) Załóżmy, że ten zbiór ah został wybrany przez loterię L jako aktywny zbiór ā w grze oraz, że pewien konkretny typ tki gracza i został wybrany przez loterię L jako typ aktywny. Oczywiście oznacza to, że typ tki musi być członkiem zbioru właściwego ah , co zachodzi jedynie wówczas, gdy typ tki jest identyczny z typem tki i użytym w zależności (4.24), co w praktyce oznacza k = ki . Jeśli te zależności zachodzą, wówczas zbiór ah oraz typ tki wspólnie spełniają zależności od (4.14) do (4.21). Jak to stwierdziliśmy w trakcie analizy gier dwu-osobowych, wypłaty vik aktywnego typu tki zależą od dwóch rzeczy: 1. od strategii wybranych przez każdego z n aktywnych typów w grze oraz 2. od tożsamości (identities) tych aktywnych typów. To oznacza jednakże, że wypłata vik typu tki zależy od profilu strategii s∗ (h) (uwzględnienie strategii) zdefiniowanego w poprzednim punkcie oraz od wektora charakterystycznego c(h) (uwzględnienie tożsamości) zdefiniowanego zależnością (4.25). Stąd też możemy zapisać następującą zależność: vik = Vik (s∗ (h), c(h)) if tki ∈ ā = ah . (4.26) Funkcję wypłaty Vik (i = 1, . . . , k; k = 1, . . . , Ki ) Harsanyi określa jako warunkowa funkcja wypłaty. Nazwa ta uzasadniona jest z dwóch powodów. Po pierwsze, jakikolwiek typ otrzyma wypłatę vik zdefiniowaną zależnością (4.26) jedynie wówczas, gdy zostanie wybrany przez loterię 48 ROZDZIAŁ 4. GRY Z NIEPEŁNĄ INFORMACJĄ W UJĘCIU J. C. HARSANYI L jako aktywny typ w tej grze (wyraża to zależność tki ∈ ā w równaniu (4.26)). Po drugie, nawet jeśli tki zostanie wybrany jako aktywny typ w grze, zależność (4.26) definiuje jego wypłatę vik jedynie wówczas, gdy loteria L wybierze zbiór właściwy ah jako aktywny zbiór ā w grze (wyraża to zależność ā = ah w równaniu (4.26)). 4.3.5 Semi-warunowe funkcje wypłaty Rozumując w sposób analogiczny jak w przypadku gier dwu-osobowych, stwierdzić można, że określony aktywny typ tki nie będzie dążył do maksymalizacji wypłaty vik zdefiniowanej zależnością (4.26), tylko wartości oczekiwanej uki tej wypłaty vik . Korzystając z wcześniejszych ustaleń, uki zdefiniować możemy w sposób następujący: uki = Uik (s∗ ) = H X πik (h) · Vik (s∗ (h), c(h)) if tki ∈ ā. (4.27) h=1 Funkcję Uik (i = 1, . . . , n; k = 1, . . . , Ki ) Harsenyi nazywa semi-warunkową (semi-conditional ) z tego względu, że funkcja ta uzależniona jest od pierwszego z warunków dotyczących funkcji warunkowej Vik (tki ∈ ā), jednakże nie jest uzależniona od warunku drugiego (ā = ah ). Innymi słowy, jakikolwiek typ tki otrzyma oczekiwaną wypłatę uki zdefiniowaną zależnością (4.27) jedynie wówczas, gdy jest aktywnym typem w grze. Jednakże jeśli tki jest aktywnym typem w grze, wówczas jego oczekiwana wypłata uki nie zależy od tego, czy konkretny zbiór właściwy ah został uprzednio wybrany przez loterię L jako aktywny zbiór ā w grze. Również i dla gier n-osobowych prawdziwym jest stwierdzenie, że jeśli określona I-gra G zostanie zreinterpretowana poprzez wprowadzenie modelu probabilistycznego, wówczas gra ta staje się w istocie C-grą G∗ . Co więcej, ta C-gra G∗ , przy założeniu interpretacji skupionej na typach (type-centered interpretation), może być rozważana jako Z-osobowa gra, w której „graczami” jest grupa Z różnych typów w grze. Za funkcje wypłaty tych „graczy” możemy przyjąć semi-warunkowe funkcje wypłaty Uik . Korzystając z tych funkcji Uik możemy w sposób prosty zdefioniować równowagi Nasha w tej Z-osobowej grze, a następnie w oparciu o stosowną teorię wyboru rozwiązań równowagowych wybrać jedno z nich jako rozwiązanie całej gry. Rozdział 5 Gry z niepełną informacją – uzupełnienie podejścia J. C. Harsanyi 5.1 Wprowadzenie W oparciu o przeprowadzoną w rozdziale 1 analizę ograniczeń informacyjnych, jakim podlegają uczestnicy realnych gier rynkowych możemy stwierdzić, że przyjęte przez J.C. Harsanyi założenie, że dany gracz wie, który z typów jest jego własnym aktywnym typem w grze (patrz rozdział 4) jest założeniem zbyt silnym dla pełnego opisu tych gier. W istocie bowiem w wielu przypadkach gracze nie posiadają pełnej informacji na temat popytu na świadczone przez siebie usługi, czy modelu ponoszonych przez siebie kosztów, a więc nie są wstanie precyzyjnie określić własnej funkcji wypłaty. Często nie mają też pewności, które ze strategii są dla nich dostępne (np. nie wszystkie spotkają się z akceptacją ze strony regulatora). Tym bardziej też nie mają pewności, które ze strategii dostępne są dla innych graczy. Innymi słowy, gracze często nie mają pewności na temat tego, jak w rzeczywistości wygląda ich macierz wypłat. W ramach analizy przeprowadzonej w rozdziale 3 stwierdziliśmy, że dla uzupełnienia podejścia zaproponowanego przez J.C Harsanyi należy rozważyć jeszcze dwa przypadki: 1. Dany gracz nie zna swojego typu i nie zna typu innych graczy; 2. Dany gracz nie zna swojego typu i zna typ innych graczy. W następnym punkcie niniejszego rozdziału zajmiemy się ich analizą, która doprowadzi nas do sformułowania funkcji wypłaty graczy w każdym z przypadków. 49 ROZDZIAŁ 5. GRY Z NIEPEŁNĄ INFORMACJĄ – UZUPEŁNIENIE PODEJŚCIA J. C. HARSANYI 50 5.2 Dany gracz nie zna swojego typu Różnica pomiędzy dwoma wyżej wymienionymi przypadkami dotyczy znajomości bądź nieznajomości typu innych graczy. Przypomnijmy, że wprowadzone przez J.C. Harsanyi określenie typu gracza określa jego pełną charakterystykę, w tym jego funkcję wypłaty, możliwe strategie gry, cele, posiadaną informację, stosunek do ryzyka itp. Harsanyi zakłada, że każdy z graczy zna pełną charakterystykę wszystkich możliwych typów każdego z graczy, w tym prawdopodobieństwo, że dany typ jest typem aktywnym w grze, jak również wie w sposób pewny, który z jego typów jest typem aktywnym. W analizie, którą przeprowadzimy w tym punkcie rozluźnimy to ostatnie założenie, tzn. dany gracz nie będzie wiedział, który z jego typów jest typem aktywnym. Zanim przejdziemy do analizy i formułowania funkcji wypłaty graczy w tych dwóch, uzupełniających przypadkach, przypomnimy w skrócie istotę podejścia przyjętego przez Harsanyi. 5.2.1 Streszczenie podejścia Harsanyi 2-osobowa I-gra Harsanyi zakłada istnienie K różnych możliwych typów gracza 1, oznaczonych odpowiednio: 1 2 m M t11 , t21 , . . . , tk1 , . . . , tK 1 , oraz M różnych typów gracza 2 oznaczonych: t2 , t2 , . . . , t2 , . . . , t2 . Przy tym znane jest prawdopodobieństwo P r(tk1 , tm 2 ) = pkm , że na początku gry loteria L wybiera określoną parę (tk1 , tm 2 ) jako aktywną parę typów w grze. P r(tk1 , tm 2 ) = pkm k = 1, . . . , K; m = 1, . . . , M. (5.1) Każdy z typów graczy posiada określoną (i znaną każdemu z graczy) funkcję wypłaty, określającą wartość jego wypłaty: v1k = V1k (sk1 , sm 2 ; k, m) (5.2) v2m = V2m (sk1 , sm 2 ; k, m) (5.3) gdzie V1k i V2m oznacza funkcje wypłaty odpowiednio typu tk1 i tm 2 . Są to funkcje warunkowe, tzn., że funkcja V1k jest funkcją wypłaty gracza 1 wówczas, gdy jego aktywnym typem w grze (typem reprezentującym tego gracza w grze) jest typ tk1 , a drugim aktywnym typem w grze jest m typ tm 2 (analogicznie odnośnie funkcji V2 ). Każdy z graczy wie, który typ, jest jego typem aktywnym. W oparciu o tę wiedzę oraz o wiedzę na temat prawdopodobieństw, że loteria L wybiera określoną parę typów aktywnych, każdy z graczy może określić prawdopodobieństwo (prawdopodobieństwa warunkowe), że drugim aktywnym typem w grze jest określony typ drugiego gracza. I tak gracz 1, wiedząc, że jego aktywnym typem w grze jest typ tk1 , oraz, że loteria L wybiera parę (tk1 , tm 2 ) z prawdopodobieństwem 51 5.2. DANY GRACZ NIE ZNA SWOJEGO TYPU pkm , określa prawdopodobieństwo π1k (m), że drugim aktywnym typem w grze jest typ tm 2 zgodnie z zależnością: pkm k . π1k (m) = P r(tm 2 |t1 ) = PK k=1 pkm (5.4) W oparciu o te prawdopodobieństwa (5.4) jak również warunkowe funkcje wypłaty (5.2), gracz 1 definiuje nową (semi-warunkową) funkcję wypłaty U1k postaci: M X uk1 = U1k (sk1 , s∗2 ) = π1k (m) · V1k (sk1 , sm 2 ; k, m). (5.5) m=1 gdzie s∗2 oznacza tu wektor M strategii: M s∗2 = (s12 , s22 , . . . , sm 2 , . . . , s2 ), (5.6) która jest jego funkcją wypłaty w grze, która jest już grą z pełną informacją (C-gra). Analogicznie gracz 2, znając prawdopodobieństwo pkm oraz wiedząc, że jego aktywnym m typem jest typ pm 2 określa prawdopodobieństwo π2 (k), że aktywnym typem gracza 1 jest typ tk1 i o parciu o to prawdopodobieństwo i warunkową funkcję wypłaty (5.3) definiuje nową (semiwarunkową) funkcję postaci: m ∗ m um 2 = U2 (s1 , s2 ) = K X π2m (k) · V2m (sk1 , sm 2 ; k, m). (5.7) k=1 gdzie s∗1 oznacza tu wektor K strategii: s∗1 = (s11 , s21 , . . . , sk1 , . . . , sK 1 ), (5.8) która jest jego funkcją wypłaty w grze, która jest już grą z pełną informacją (C-gra). W interpretacji skupionej na typach, wprowadzony model probabilistyczny przekształcił oryginalną dwu osobową I-grę G w (K+M)-osobową C-grę G∗ . „Graczami” w tej C-grze jest K typów gracza 1 i M typów gracza 2 z funkcjami wypłat zdefiniowanymi zależnościami (5.5) i (5.7). Rozwiązaniem tej gry, z racji na założoną jednoczesność wykonywania ruchów przez graczy jest jedna z równowag Nash’a, czyli taki łączny zbiór strategii: 0 0 0 0 0 0 0 0 0 0 0 1 2 m M s = (s∗1 , s∗2 ) = (s11 , s21 , . . . , sk1 , . . . , sK 1 , s2 , s2 , . . . , s2 , . . . , s2 ), (5.9) dla którego zachodzą następujące zależności [98]: 0 0 0 U1k (sk1 , s2∗ ) U1k (sk1 , s∗2 )∀sk1 , ∀k = 1, . . . K. 0 0 0 m ∗ m m U2m (s∗1 , sm 2 ) U2 (s1 , s2 )∀s2 , ∀m = 1, . . . M. (5.10) (5.11) ROZDZIAŁ 5. GRY Z NIEPEŁNĄ INFORMACJĄ – UZUPEŁNIENIE PODEJŚCIA J. C. HARSANYI 52 N-osobowa I-gra Harsanyi zakłada, że każdy gracz i (i = 1, . . . , n) posiada Ki różnych możliwych typów, które i oznacza jako t1i , . . . , tki , . . . , tK i . Każdy z n graczy może być reprezentowany w grze przez jeden ze swoich typów. Taki zbiór typów, których liczba odpowiada liczbie graczy, a przy tym każdy typ reprezentuje innego gracza Harsanyi nazywa zbiorem właściwym i oznacza jako ah . Każdy z typów tki gracza i, posiada znaną każdemu z graczy warunkową funkcję wypłaty vik = Vik (s∗ (h), c(h)), (5.12) gdzie s∗ (h) jest zbiorem strategii, wybieranych przez typy (graczy reprezentowanych przez te typy) należące do zbioru właściwego ah , natomiast c(h) jest tzw. wektorem charakterystycznym dla zbioru ah (do którego należy m.in.typ tki ), który jest zbiorem indeksów typów ki poszczególnych graczy i, należących do zbioru właściwego ah : c(h) = (k1 , . . . , ki , . . . , kn ). (5.13) Zbiór aktywny ā to taki zbiór właściwy, w którym każdy z typów jest aktywnym typem danego gracza. Harsanyi zakłada, że na początku gry loteria L może wybrać określony zbiór właściwy ah jako zbiór aktywny ā z prawdopodobieństwem rh : P r(ā = ah ) = rh dla h = 1, . . . , H. (5.14) Gracz i wie, że jego aktywnym typem w grze jest typ tki , czyli, że typ ten należy do zbioru aktywnego ā. Ten fakt pozwala mu oszacować prawdopodobieństwo tego, że pozostali gracze są reprezentowani przez konkretne ich typy, czyli że dany zbiór właściwy ah jest zbiorem aktywnym. Jest to prawdopodobieństwo warunkowe: πik (h) = P r(ā = ah |tki ∈ ā) = P rh h∈Bik rh , (5.15) gdzie Bik jest zbiorem indeksów h, takich, że zbiór właściwy ah należy do rodziny wszystkich zbiorów właściwych zawierających w sobie typ tki (rodzina Aki ). W oparciu o to prawdopodobieństwo, oraz warunkową funkcję wypłaty typ tki wyznacza swoją nową (semi-warunkową) funkcję wypłaty postaci: uki = Uik (s∗ ) = H X πik (h) · Vik (s∗ (h), c(h)) if tki ∈ ā, (5.16) h=1 która definiuje już grę z pełną informacją (C-grę). Rozwiązaniem tej gry, z racji na założoną jednoczesność wykonywania ruchów przez graczy jest jedna z równowag Nash’a 5.2. DANY GRACZ NIE ZNA SWOJEGO TYPU 5.2.2 53 Dany gracz nie zna swojego typu i zna typ innych graczy Ten przypadek, przypadek, w którym dany gracz nie zna swojego typu, natomiast zna typ innych graczy może się wydawać nieco dziwaczny, jednakże na gruncie teoretycznym nie można go odrzucić. A i przypuszczać można, że na gruncie praktycznym znaleźć można by sytuacje do tego przypadku pasujące. Przykładem może tu być sytuacja, gdy na dobrze zdefiniowany rynek (z pełną i jasną charakterystyką obecnych na nim graczy) wchodzi nowy podmiot, nie posiadający wystarczającego doświadczenia, by właściwie ocenić charakter własnej funkcji wypłaty (np. modelu ponoszonych kosztów). Osobno zostanie omówiony przypadek gry 2-osobowej i n-osobowej. 2-osobowa I-gra Przypadek, w którym dany gracz (załóżmy gracz 1) nie zna swojego typu, natomiast zna typ drugiego gracza jest w istocie bardzo podobny, do omawianego w oryginale przez Harasnyi przypadku, gdy dany gracza zna swój typ, nie zna zaś typu drugiego gracza. W przypadku, gdy gracz 1 znał swój typ, wiedział, że reprezentujący go typ tk1 jest aktywnym typem wybranym przez loterię L, a więc, że należy do pary aktywnych typów w grze (tk1 , tm 2 ). Na podstawie wartości prawdopodobieństwa pkm , czyli prawdopodobieństwa, że loteria L wybierze jako aktywne typy k w grze właśnie parę (tk1 , tm 2 ) oraz wiedzę, że t1 jest typem aktywnym, gracz 1 określał (zgodnie z zależnością (5.4)) prawdopodobieństwo (warunkowe) π1k (m), że drugim aktywnym typem w grze jest typ tm 2 . Zauważmy, że teraz, gdy gracz 1 nie zna swojego typu, czyli nie wie, który z typów tk1 jest jego aktywnym typem w grze, natomiast zna typ gracza 2, czyli wie, który z typów tm 2 jest jego (czyli gracza 2) aktywnym typem w grze, to w oparciu o tę wiedzę, jak również znajomość prawdopodobieństwa pkm , czyli prawdopodobieństwa, że loteria L wybierze jako aktywne typy m w grze właśnie parę (tk1 , tm 2 ), może wyznaczyć warunkowe prawdopodobieństwo π2 (k), czyli prawdopodobieństwo, że drugim aktywnym typem w grze jest jego k-ty typ tk1 . Wartość tego prawdopodobieństwa wyznaczy się w oparciu o tę samą zależność, z której gracz 2 w oryginalnym przykładzie przyjętym przez Harsanyi (czyli gdy gracz 2 znał swój typ, nie znał zaś typu gracz 1) wyznaczał to prawdopodobieństwo. A zatem prawdopodobieństwo π2m (k), że aktywnym typem gracz 1 jest typ tk1 , przy znajomości (czyli pod warunkiem) drugiego aktywnego typu w grze tm 2 wyniesie: pkm . π2m (k) = P r(tk1 |tm 2 ) = PM m=1 pkm (5.17) W oparciu o tę wiedzę, gracz 1 może wyznaczyć swoją nową (semi-warunkową) funkcję ROZDZIAŁ 5. GRY Z NIEPEŁNĄ INFORMACJĄ – UZUPEŁNIENIE PODEJŚCIA J. C. HARSANYI 54 wypłaty zgodnie z zależnością: m ∗ m um 1 = U1 (s1 , s2 ) = K X π2m (k) · V1k (sk1 , sm 2 ; k, m). (5.18) k=1 gdzie s∗1 oznacza tu wektor K strategii: s∗1 = (s11 , s21 , . . . , sk1 , . . . , sK 1 ), (5.19) Funkcja ta jest funkcją wypłaty gracza 1 w grze, która jest już grą z pełną informacją (C-gra). Analogicznie, jeśli takie same założenia dotyczą gracza 2, tzn. że gracz ten wie, że aktywnym typem gracza 1 jest typ tk1 , natomiast nie wie, który z jego typów tm 2 jest drugim aktywnym typem w grze, to swoją (semi-warunkową) funkcję wypłaty w C-grze wyznaczyć może zgodnie z zależnością: uk2 = U2k (sk1 , s∗2 ) = M X π1k (m) · V2m (sk1 , sm 2 ; k, m). (5.20) m=1 gdzie s∗2 oznacza tu wektor M strategii: M s∗2 = (s12 , s22 , . . . , sm 2 , . . . , s2 ). (5.21) Zauważmy, że w zależnościach (5.18) i (5.20) zmieniło się indeksowanie wartości wypłaty i semi-warunkowej funkcji wypłaty, względem rozpatrywanych w przykładzie Harsanyi zależności (5.5) i (5.7). Funkcja wypłaty gracz 1 nie jest już oznaczona jako U1k , ale jako U1m . Analogicznie funkcja wypłaty gracza 2 nie jest już oznaczana jako U2m , ale jako U2k . Podobnie mamy oznaczone k wartości wypłat um 1 i u2 . Indeks górny bowiem w każdym z przypadków informował nas o tym, który z typów jest brany jako dany (jako warunek) przy wyznaczaniu zarówno warunkowych prawdopodobieństw, jak i semi-warunkowych funkcji wypłat. Innymi słowy funkcja U1m , zdefiniowana zależnością (5.18) jest funkcją wypłaty gracza 1 wówczas, gdy aktywnym typem gracza k 2 jest typ tm 2 . Analogicznie funkcja U2 , zdefiniowana zależnością (5.20) jest funkcją wypłaty gracza 2 jeśli aktywnym typem gracza 1 jest typ tk1 . Przy założeniu jednoczesnej kolejności ruchów graczy rozwiązaniem tak zdefiniowanej gry G∗ będzie jedna z dostępnych w tej grze równowag Nasha. N-osobowa I-gra W szczególnym przypadku dany gracz i nie zna swojego typu, natomiast zna typy wszystkich innych graczy. Możemy też rozważyć przypadek bardziej ogólny, w którym gracz i zna typy jedynie części graczy, natomiast nie zna swojego typu, jak również typów pozostałych (z wykluczeniem znanej części graczy). 55 5.2. DANY GRACZ NIE ZNA SWOJEGO TYPU Oznaczmy przez tki h typ gracza i, który należy do zbioru właściwego ah . Wobec tego vikh = Vikh (s∗ (h), c(h)) (5.22) oznaczać będzie wypłatę gracza i, gdy jest on typu tki h , a aktywnym zbiorem w grze jest zbiór ah . Rozważmy przypadek najprostszy, zakładając, że gracz i zna typ tylko jednego z graczy j – tm j . Posiadając tę informację, gracz i może teraz określić prawdopodobieństwo, że jako aktywny zbiór ā loteria wybrała konkretny zbiór ah wyniosłoby: rh πjm (h) = P r(ā = ah |tm j ∈ ā) = P . (5.23) πjm (h) · Vikh (s∗ (h), c(h)). (5.24) h∈Bjm rh W tej sytuacji, funkcja wypłaty gracza i wyrazi się zależnością: ∗ ui = Ui (s ) = H X h=1 p Gdyby gracz i znały typy dwóch graczy tm j i tl wówczas prawdopodobieństwo, że zbiorem aktywnym ā będzie konkretny zbiór ah wyniesie: mp p πjl (h) = P r(ā = ah |(tm j , tl ∈ ā)) = P rh h∈(Bjm +Blp ) rh . (5.25) Oznaczmy więc przez t̄ zbiór wszystkich aktywnych w danej grze typów tm j (przy czym t̄ ∈ ā), o których gracz i wie, że są aktywne oraz przez B̄ zbiór indeksów h zbiorów właściwych, które zawierają w sobie aktywne typy tm j należące do zbioru t̄. Prawdopodobieństwo, że loteria L za aktywny zbiór ā wybrała w tej grze zbiór właściwy ah wyniesie wówczas: rh . πt̄ (h) = P r(ā = ah |(t̄ ∈ ā)) = P h∈B̄ rh (5.26) Funkcja wypłaty gracza i wyrazi się wówczas zależnością: ui = Ui (s∗ ) = H X πt̄ (h) · Vikh (s∗ (h), c(h)) (5.27) h=1 Funkcja ta definiuje już grę z pełną informacją (C-grę). Rozwiązaniem tej gry, z racji na założoną jednoczesność wykonywania ruchów przez graczy jest jedna z równowag Nash’a 5.2.3 Dany gracz nie zna swojego typu i nie zna typu innych graczy Być może realne sytuacje gry rynkowej najlepiej pasują do tego przypadku. Źródeł niepewności i ryzyka jest na tyle dużo i są one na tyle trudne do zidentyfikowania i zrozumienia, że gracze praktycznie zawsze posiadają niepewną wiedzę tak zarówno na tema własnej charakterystyki (typu) jak i charakterystyki (typów) innych graczy. Podobnie jak w poprzednim punkcie osobno omówimy przypadek gry 2-osobowej i n-osobowej. ROZDZIAŁ 5. GRY Z NIEPEŁNĄ INFORMACJĄ – UZUPEŁNIENIE PODEJŚCIA J. C. HARSANYI 56 2-osobowa I-gra W przypadku, gdy dany gracz, załóżmy gracz 1 nie zna ani swojego typu, ani typu drugiego gracza wszystko, co może stwierdzić to to, że loteria L wybierze określoną parę typów (tk1 , tm 2 ) jako aktywne typy w grze z prawdopodobieństwem równym pkm . Co więcej gracz ten zna swoją warunkową funkcję wypłaty v1k , zdefiniowaną zależnością: v1k = V1k (sk1 , sm 2 ; k, m) (5.28) Jest to jego funkcja wypłaty w I-grze G, czyli w grze z niepełną informacją. Przechodząc na model probabilistyczny, czyli C-grę G∗ , grę z pełną (choć nie doskonałą – imperfect) informacją, gracz ten musi wyznaczać swoją wypłatę u1 jako wartość oczekiwaną (zarówno po własnych typach jak i typach gracza 2) z wypłat warunkowych v1k , a więc zgodnie z zależnością: u1 = U1 (s∗1 , s∗2 ) = K X M X pkm · V1k (sk1 , sm 2 ; k, m). (5.29) k=1 m=1 Analogicznie, jeśli gracz 2 nie zna ani swojego typu, ani typu gracza 1, to swoją funkcję wypłaty w C-grze G∗ wyznaczyć może zgodnie z zależnością: u2 = U2 (s∗1 , s∗2 ) = K X M X pkm · V2m (sk1 , sm 2 ; k, m). (5.30) k=1 m=1 Przy założeniu jednoczesnej kolejności ruchów graczy rozwiązaniem tak zdefiniowanej gry G∗ będzie jedna z dostępnych w tej grze równowag Nasha. N-osobowa I-gra W przypadku gry N-osobowej gdy dany gracz i nie zna ani swojego typu, ani typów pozostałych (N-1) graczy wszystko, co może stwierdzić to to, że loteria L wybierze określony zbiór właściwy ah jako zbiór aktywny ā z prawdopodobieństwem rh . Co więcej gracz i zna swoją warunkową funkcję wypłaty vik , zdefiniowaną zależnością: vik = Vik (s∗ (h), c(h)), (5.31) Nie wie jednakże, który z typów tki aktualnie go reprezentuje. Jest to jego funkcja wypłaty w I-grze G, czyli w grze z niepełną informacją. Przechodząc na model probabilistyczny, czyli C-grę G∗ , grę z pełną (choć nie doskonałą – imperfect) informacją, gracz ten musi wyznaczać swoją wypłatę u1 jako wartość oczekiwaną (zarówno po własnych typach jak i typach pozostałych graczy) z wypłat warunkowych v1kh , a więc zgodnie z zależnością: 57 5.3. DANY GRACZ WYKONUJE RUCH JAKO PIERWSZY ui = Ui (s∗ ) = H X rh · Vikh (s∗ (h), c(h)) (5.32) h=1 Analogiczną postać będzie miała funkcja każdego z pozostałych graczy, który nie zna ani swojego typu ani typów pozostałych graczy. Przy założeniu jednoczesnej kolejności ruchów graczy rozwiązaniem tak zdefiniowanej gry G∗ będzie jedna z dostępnych w tej grze równowag Nasha. 5.2.4 Przypadki niesymetrycznej informacji Zarówno w oryginalnym przypadku rozpatrywanym przez Harsanyi, jak i w dwóch wyżej omawianych zakładano symetrię odnośnie znajomości, bądź nie znajmości określonych typów w grze: albo zakładano, że każdy z graczy zna swój typ, ale nie zna typów innych graczy, albo, że każdy zna typy innych graczy, ale nie zna swojego, albo, że żaden nie zna typu żadnego z graczy. W realnych sytuacjach rynkowych oczywiście możemy mieć również do czynienia z sytuacjami mniej symetrycznymi. I tak np. możliwa jest sytuacja, w której gracz 1 posiada pełną informację na temat wszystkich aktywnych typów w grze, gracz 2 może znać tylko swój aktywny typ, nie znać natomiast pozostałych aktywnych typów, gracz 3 może nie znać swojego typu, znać natomiast typy innych graczy, zaś gracz 4 może nie znać żadnych aktywnych typów w grze. A zatem funkcja wypłaty każdego z graczy przyjmie inną postać. Dla gracza 1 będzie to po prostu funkcja V1 1 , dla gracza 2 semi-warunkowa funkcja U2 jak w oryginalnym przykładzie Harsanyi, dla gracza 3 semi-warunkowa funkcja U3 podobna do przedstawionej w punkcie 5.2.2 niniejszego rozdziału, natomiast dla gracza 4 funkcja U4 analogiczna do przedstawionej w punkcie 5.2.3. Przy założeniu, że gracze wykonują ruchy jednocześnie rozwiązaniem gry będzie jedna z dostępnych (albo jedyna) równowag Nasha. 5.3 Dany gracz wykonuje ruch jako pierwszy Zarówno w oryginalnym przykładzie rozważanym przez Harsanyi jak i w przypadkach analizowanych w tym rozdziale zakładano, że gracze wykonują ruchy równocześnie. Przy takim założeniu właściwym rozwiązaniem gry jest jednak z równowag Nasha (uzasadnienie tego faktu znaleźć można w Dodatku C). W wielu konkretnych przypadkach to założenie nie musi być spełnione. Co więcej, dany gracz wcale nie musi wiedzieć jaka będzie kolejność wykonywania ruchów w grze. Ten fakt, jak to już stwierdzono w rozdziale 3 stanowi również źródło niepewności: jest przykładem ograniczenia informacyjnego. Co więcej, ograniczenie to nie zostało uwzględnione 1 Dla prostoty omijamy tu indeksy górne, odpowiadające oznaczeniom aktywnych typów. ROZDZIAŁ 5. GRY Z NIEPEŁNĄ INFORMACJĄ – UZUPEŁNIENIE PODEJŚCIA J. C. HARSANYI 58 przez Harsanyi (potwierdzeniem tego jest jego stwierdzenie, że właściwym rozwiązaniem gry G∗ jest jedna z równowag Nasha). Zanim jednak przejdziemy, do potraktowania kolejności ruchów jako zmiennej nieznanej w modelu, przyjrzymy się najpierw w jaki sposób gracze powinni rozgrywać gry z niepełną informacją (w rozumieniu przyjętym przez Harsanyi) jeśli kolejność ruchów jest ustalona i dany gracz i wykonuje ruch jako pierwszy2 . Rozważania przeprowadzone w poprzednich punktach pokazały, że generalnie każdą grę z niepełną informacją można przedstawić za pomocą probabilistycznego modelu gry z pełną (choć niedoskonałą) informacją i że funkcja wypłaty każdego z graczy może zostać wyrażona w sposób jednoznaczny. Postać tej funkcji zależna była od informacji jaką dany gracz posiadał na temat własnego typu, jak i typów innych graczy. Dla prostoty przyjmiemy, że w grze bierze udział tylko dwóch graczy i oraz j a także, że ich funkcje wypłaty C-grze G∗ oznaczone będą jako Ui oraz Uj . W zależności od posiadanej informacji funkcje te mogą przybrać różną postać (jak w punktach omawianych wyżej). Generalnie jest mają one formę wartości oczekiwanej z warunkowych funkcji wypłaty Vi oraz Vj (funkcji wypłaty w I-grze G), których postać jest a priori znana, przy czym prawdopodobieństwa pi oraz pj przyjmują formę zależną od posiadanej informacji na temat własnego typu, jak też typu drugiego gracza. W uproszczony sposób zapisać to możemy w następującej postaci: Ui = X pki Vik (5.33) pkj Vjk . (5.34) k Uj = X k W przypadku, gdy gracze wykonują ruchy sekwencyjnie najpierw jeden gracz wykonuje ruch (załóżmy gracz i) a potem drugi. Przy czym obaj gracze dążą do maksymalizacji swoich funkcji wypłat. A więc gracz i, wybierając swoją strategię si musi przewidywać w oparciu o wiedzę, jaką posiada na temat funkcji wypłaty gracz j – Uj , jaka będzie jego odpowiedź. Istotną jest tu rzecz, iż gracz i zna tylko probabilistyczny model funkcji wypłaty gracza j: funkcja Uj jest w istocie agregatem (tu wartość oczekiwana) jego rzeczywistych funkcji wypłaty Vjk , której postać gracz i jedynie przewiduje z prawdopodobieństwem pj . W istocie mamy więc tu przykład klasycznej sytuacji podejmowania decyzji w warunkach ryzyka, a jak wiadomo maksymalizacja wartości oczekiwanej nie jest jedynym możliwym podejściem do tego typu sytuacji [38, 66]. W szczególności nie uwzględnia ona stosunku graczy do ryzyka (maksymalizacja wartości oczekiwanej zakłada postawę neutralności wobec ryzyka). Rozwiązanie tego typu sytuacji zależne jest więc od subiektywnych preferencji graczy. Generalnie więc funkcje Ui oraz Uj 2 Przypadek, w którym dany gracz wykonuje ruch jako drugi jest o tyle prostym, że w momencie podejmowania przez niego decyzji znana jest już decyzja gracza poprzedzającego jego ruch. 59 5.4. NIEZNANA KOLEJNOŚĆ RUCHÓW GRACZY przedstawić można w postaci: Ui = f(pki , Vik ) (5.35) Uj = f(pkj , Vjk ) (5.36) gdzie funkcja f jest tu funkcją agregującą wypłaty vik oraz vjk w sposób zgodny z subiektywnym stosunkiem graczy do ryzyka. Szczególnym przypadkiem będzie tu sytuacja w ramach której poszczególne prawdopodobieństwa pki czy pkj przyjmować będą jednakową wartość. Będzie to więc sytuacja wyboru decyzji w warunkach niepewności, czy inaczej mówiąc przykład gry przeciwko naturze. A więc i funkcja agregująca przyjmować będzie postać określonego kryterium wyboru strategii w tego typu grze [41, 48]. Generalnie, wykonujący ruch jako pierwszy gracz i wybierał będzie taką strategię ŝi , dla której zachodzi: ŝi = arg max Ui (sli , ŝj (sli )) l (5.37) gdzie ŝj (sli ) jest najlepszą odpowiedzią gracza j na daną (l-tą) strategię sli gracza i: ŝj (sli ) = arg max Uj (sli , snj )∀i. n 5.4 (5.38) Nieznana kolejność ruchów graczy W przypadku nieznajomości kolejności ruchów, dany gracz ma możliwość wyboru pomiędzy rozwiązaniem Nasha, właściwym dla sytuacji gry z jednoczesnym wykonywaniem ruchów, a rozwiązaniem właściwym dla gry sekwencyjnej. Jest to więc typowy problem dwukryterialny [66, 100]. Jeśli oznaczmy przez Z R rozwiązanie Nasha danej gry – rozwiązanie właściwe dla gry z równoczesnym wykonywaniem ruchów, oraz przez Z S rozwiązanie właściwe dla gry sekwencyjnej, w której gracz i wykonuje ruch jako pierwszy, to jego problem decyzyjny (problem wyboru optymalnej strategii gry s̄i zapisać można w formie następującego zadania optymalizacji: ŝi = arg max F(Z R , Z S ), (5.39) gdzie F jest odpowiednią funkcją skalaryzującą, zgodną z preferencjami gracza i. Analogiczne podejście należałoby zastosować w przypadku niepewności odnośnie tego, czy gra będzie jednorazowa czy powtarzalna3 . 3 Analiza właściwości gier rozgrywanych wielokrotnie pozostanie tematem przyszłych badań. 60 5.5 ROZDZIAŁ 5. GRY Z NIEPEŁNĄ INFORMACJĄ – UZUPEŁNIENIE PODEJŚCIA J. C. HARSANYI Wartość informacji Ograniczenia informacyjne, jakim gracze podlegają kształtuje wynik, jaki spodziewają się uzyskać. Wynik ten zależny jest od postaci ich funkcji wypłaty, zależnej od posiadanej przez nich informacji, od ich stosunku do ryzyka kształtującego postać funkcji agregującej f, a także od modelu preferencji odzwierciedlonego w funkcji skalaryzującej F. Pokonanie określonego ograniczenia informacyjnego kształtuje w nowy sposób oczekiwany wynik gry. Różnica pomiędzy tymi wynikami stanowi właściwą miarę wartości pozyskanej informacji. Część II Dodatki i Zakończenie 61 Dodatek A Preferowana kolejność ruchów a równowaga Nasha i model gry Stackelberga Rozpatrywany jest przypadek gry rynkowej, w której udział bierze dwóch graczy: A i B. Strategie ai gracza A odzwierciedlają świadczone przez niego usługi na rynku detalicznym (dla użytkowników końcowych) oraz związane z nimi ceny (ich konkretna wysokość). Strategie bj odzwierciedlają usługi i związane z nimi ceny na rynku detalicznym gracza B. Usługi i związane z nimi ceny na rynku hurtowym (usługi świadczone w relacji międzyoperatorskiej) reprezentowane są przez strategie hl . O ile na strategie na rynkach detalicznych gracze posiadają indywidualny wpływ (ustalają je w sposób niezależny) o tyle strategie na rynku hurtowym ustalane są w ramach negocjacji międzyoperatorskich, a więc wybór określonej strategii hl zależny jest od decyzji obu graczy. Dla potrzeb analizy przyjęte zostanie, że strategie hl oznaczają decyzje hipotetycznego gracza H. Gracze A i B oceniają swoje decyzje z punktu widzenia pojedynczego kryterium – funkcji wypłaty, jak np. zysk, udział w rynku, czy dystrybucja ruchu w sieci. Wypłata (wartość funkcji wypłaty) jaką gracze otrzymują jest rezultatem podjęcia odpowiednich decyzji na rynkach detalicznch: ai oraz bj , jak też na rynku hurtowym: hl . W rezultacie ustalenia strategii ai , bj i hl gracz A otrzymuje wypłatę VjlA (ai ), natomiast gracz B wypłatę VilB (bj ). Wynik gry określony jest parą wypłat [VjlA (ai )], VilB (bj )]. Obaj gracze znają nawzajem swoje macierze wypłat, jak również cel, do jakiego dążą. Ponadto przyjęte zostanie, że obaj gracze dążą wyłącznie do maksymalizacji własnej funkcji wypłaty1 . 1 W praktyce wartości funkcji wypłaty uzyskuje się na podstawie analizy konkretnych modeli popytu na świad- czone usługi, modelu kosztu oraz ogólnego modelu architektury sieci. Gracze (przedsiębiorstwa telekomunikacyjne) 63 64 DODATEK A. PREFEROWANA KOLEJNOŚĆ RUCHÓW A RÓWNOWAGA NASHA I MODEL GRY STACKELBERGA Ruchy poszczególnych graczy reprezentowane są przez procesy ustalania cen na odpowiednich rynkach: • A – proces ustalania cen na rynku detalicznym gracza A, • B – proces ustalania cen na rynku detalicznym gracza B, • H – proces negocjacji stawek rozliczeniowych pomiędzy graczami A i B (ruch hipotetycznego gracza H). Zakłada się, że procesy A, B i C są rozłączne, a kolejność ruchów jest ustalona. Sytuacja w której żaden z procesów nie dobiegł końca określa się mianem gry podwójnej [42]. Sytuacja w której jeden z graczy: A, B lub H ustalił już swoje ceny (wybrał określoną strategię gry) określa się mianem gry pojedynczej. Gra przebiega więc dwu fazowo. W pierwszej fazie rozgrywana jest gra podwójna, natomiast w drugiej gra pojedyncza. Określona gra pojedyncza jest więc rezultatem rozegrania gry podwójnej w określony sposób. Dla potrzeb analizy przyjęta zostanie konwencja uprządkowywania wypłat graczy w formie macierzy wypłat. W tabeli A.1 przedstawiono przykładową macierz wypłat w grze podwójnej. Każdy z graczy (A, B i H) ma tu do wyboru po trzy strategie. Jeśli w tej grze pierwszym ruchem Tabela A.1: Przykładowa macierz wypłat w grze podwójnej. h1 h2 b1 b2 b3 a1 [2, 3] [3, 1] [1, 4] a2 [2, 2] [5, 3] a3 [3, 2] [3, 4] h3 b1 b2 b3 b1 b2 b3 a1 [1, 2] [2, 3] [3, 2] a1 [2, 5] [3, 4] [4, 3] [3, 5] a2 [5, 2] [4, 3] [4, 4] a2 [1, 1] [2, 5] [2, 5] [4, 2] a3 [2, 3] [3, 2] [2, 3] a3 [3, 3] [3, 2] [2, 3] będzie proces negocjacji cen na rynku hurtowym H, które zakończą się wyborem strategii h1 (ustaleniem określonego przez tę strategię zakresu usług i odpowiadających im cen), wówczas gra pojedyncza, w której udział biorą gracze A i B opisana będzie macierzą wypłat jak w tabeli A.2. Jeśli w rezultacie jej rozegrania gracz A, wykonujący ruch jako pierwszy, wybierze np. strategię A (a ), V B (b )] = [3, 4]. a3 , natomiast gracz B odpowie strategią b2 wówczas ustali się wynik [V21 3 31 2 nie zawsze muszą dążyć do maksymalizacji wartości kryterium, które przyjmują za miarę oceny podjętych decyzji. Gracze równie dobrze mogą dążyć do minimalizacji, czy stabilizacji tych wartości. W takich przypadkach należy te kryteria przekształcić do postaci maksymalizowanej. Ogólniejszym natomiast będzie przypadek, w którym gracze dążą zarówno do maksymalizacji własnej funkcji wypłaty (cel indywidualnie efektywny), jak też do minimalizacji funkcji wypłaty drugiego gracza (cel antagonistyczny). A.1. PREFEROWANA KOLEJNOŚĆ RUCHÓW W GRZE POJEDYNCZEJ 65 Tabela A.2: Macierz wypłat w grze pojedynczej. A.1 b1 b2 b3 a1 [2, 3] [3, 1] [1, 4] a2 [2, 2] [5, 3] [3, 5] a3 [3, 2] [3, 4] [4, 2] Preferowana kolejność ruchów w grze pojedynczej Przyjęta jako ustalona kolejność ruchów w grze nie jest bynajmniej dla graczy bez znaczenia. Wykazane to zostanie na przykładzie gry pojedynczej. Rozpatrzmy grę z macierzą wypłat jak w tabeli A.3. W tej grze obaj gracze A i B, dążący do maksymalizacji własnej funkcji wypłaty chcieliby móc wykonać ruch jako pierwszy. Jeśli pierwszy wykona ruch gracz A wówczas wybierze strategię a2 , co w rezultacie odpowiedzi b2 gracza B ustali wynik [3, 2]. Gdyby jednak gracz B wykonywał ruch jako pierwszy, wówczas wybrałby strategię b1 , co w rezultacie odpowiedzi a1 gracza A ustaliłoby wynik [2, 3]. A zatem dla obu graczy korzystnie jest ruszyć się jako pierwszy. Tabela A.3: Macierz wypłat w grze pojedynczej z preferencją pierwszego. b1 b2 a1 [2, 3] [1, 1] a2 [1, 1] [3, 2] Sytuacja będzie już inna, gdy macierz wypłat w grze pojedynczej przedstawiała się będzie jak w tabeli A.4. W tym przypadku obu graczom opłaca się ruszyć jako drugi. Jeśli pierwszy ruszy się gracz A wówczas niezależnie od tego, czy wybierze strategię a1 czy a2 ustali się wynik [2, 3]. Jeśli pierwszy ruszy się gracz B, wówczas niezależnie od tego czy wybierze strategię b1 czy b2 ustali się wynik [3, 2]. Każdy z graczy otrzymuje więc większą wypłatę wówczas, gdy rusza się jako drugi. Zakładając, że żaden z graczy nie ma strategii niejednoznacznych, czyli takich, które prowadzą do jednakowej wypłaty dla gracza, który ją posiada, jednakże do innych wypłat dla drugiego gracza, wprowadzić można następujące definicje: Definicja A.1.1 Korzystnym dla gracza A jest ruszyć się jako pierwszy, wtedy i tylko wtedy, DODATEK A. PREFEROWANA KOLEJNOŚĆ RUCHÓW A RÓWNOWAGA NASHA I MODEL GRY STACKELBERGA 66 Tabela A.4: Macierz wypłat w grze pojedynczej z preferencją drugiego. b1 b2 a1 [2, 3] [3, 2] a2 [3, 2] [2, 3] gdy: VjA00 (ai0 ) > VjA0 (ai00 ) Korzystnym dla gracza A jest ruszyć się jako drugi, wtedy i tylko wtedy, gdy: VjA00 (ai0 ) < VjA0 (ai00 ) gdzie: i0 – indeks optymalnej strategii gracza A, gdy A rusza się jako pierwszy, j 00 – indeks strategii racjonalnej odpowiedzi gracza B, j0 – indeks optymalnej strategii gracza B, gdy B rusza się jako pierwszy, i00 – indeks strategii racjonalnej odpowiedzi gracza A, Użyte w powyższej definicji pojęcie optymalnej strategii gracza A oznacza tu taką strategię ai , która z uwzględnieniem najkorzystniejszej z punktu widzenia gracza B odpowiedzi (strategii b̂(ai )) da graczowi A najlepszą możliwą wypłatę: ai = â = arg maxi VĵA (ai ). Natomiast pojęcie racjonalnej odpowiedzi gracza wprowadzono w celu zachowania ogólności rozważań. O ile bowiem pojęcie odpowiedzi optymalnej odnosiłoby się wyłącznie do oceny z punktu widzenia wartości wypłaty, jaką otrzymuje dany gracz (ten, który odpowiada) o tyle pojęcie odpowiedzi racjonalnej zawiera w sobie również możliwość formułowania celów nie tylko optymalnych, jak przyjęta tu maksymalizacja własnej funkcji wypłaty) ale również celów antagonistycznych, mierzących bezpośrednio w pogorszenie wartości wypłaty drugiego gracza lub ukształtowanie odpowiedniej różnicy pomiędzy własną wypłatą, a wypłatą drugiego gracza [42]. Analogiczną definicję sformułować można dla gracza B. Sytuacja jaką mieliśmy w przypadku gier z macierzą wypłat jak w tabelach A.3 i A.4, kiedy to dla obu graczy korzystnie było ruszyć się jako pierwszy lub jako drugi nie jest przypadkowa. W istocie – poza przypadkami niejednoznaczności strategii, co omówione zostało w dalszej części tekstu – preferencje obu graczy odnośnie optymalnej kolejności ruchów są zawsze przeciwstawne: jeśli korzystnie jest dla gracza A ruszyć się jako pierwszy, to również korzystnie dla gracza B jest ruszyć się jako pierwszy; jeśli korzystnie jest dla gracza A ruszyć się jako drugi, to również korzystnie dla gracza B jest ruszyć się jako drugi. Prawdziwe są bowiem poniższe twierdzenia: A.1. PREFEROWANA KOLEJNOŚĆ RUCHÓW W GRZE POJEDYNCZEJ 67 Twierdzenie A.1.1 Korzystnym dla gracza A jest ruszyć się jako pierwszy wtedy i tylko wtedy, gdy korzystnym by ruszyć się jako pierwszy jest również dla gracza B. B VjA00 (ai0 ) > VjA0 (ai00 ) ⇐⇒ ViB 00 (bj 0 ) > Vi0 (bj 00 ) gdzie: i0 – indeks optymalnej strategii gracza A, gdy A rusza się jako pierwszy, j 00 – indeks strategii racjonalnej odpowiedzi gracza B, j0 – indeks optymalnej strategii gracza B, gdy B rusza się jako pierwszy, i00 – indeks strategii racjonalnej odpowiedzi gracza A, Dowód. Założenie, iż korzystnym dla gracza A jest ruszyć się jako pierwszy (wybrać strategię ai0 ) równoznaczne jest ze stwierdzeniem, iż wartość wypłaty (VjA00 (ai0 )), jaką w wyniku racjonalnej odpowiedzi (bj 00 ) gracza B (maksymalizujacej wypłatę ViB 0 (bj )) gracz A otrzyma jest lepsza od tej (VjA0 (ai00 )), jaką otrzymałby, gdyby gracz B, znający racjonalne odpowiedzi gracza A (ai00 ) ruszał się jako pierwszy (bj 0 ). Innymi słowy zachodzi zależność: VjA00 (ai0 ) > VjA0 (ai00 ) Fakt, że gracz B, w sytuacji ruszania się jako pierwszy wybrałby strategię inną niż bj 00 (bj 0 6= bj 00 ) oznacza w istocie – poza przypadkami niejednoznaczności, że wartość wypłaty w przypadku ruszania się jako pierwszy (ViB 00 (bj 0 )) jest dla niego lepsza, niż w przypadku ruszania się, jako drugi. Stąd: B ViB 00 (bj 0 ) > Vi0 (bj 00 ) Dowód drugiej strony implikacji jest analogiczny. Założenie, iż korzystnym dla gracza B jest ruszyć się jako pierwszy (wybrać strategię bj 0 ) równoznaczne jest ze stwierdzeniem, iż wartość wypłaty (ViB 00 (bj 0 )), jaką w wyniku racjonalnej odpowiedzi (ai00 ) gracza A (maksymalizujacej wypłatę VjA0 (ai )) gracz B otrzyma jest lepsza od tej (ViB 0 (bj 00 )), jaką otrzymałby, gdyby gracz A, znający racjonalne odpowiedzi gracza B (bj 00 ), ruszał się jako pierwszy (ai0 ). Innymi słowy zachodzi zależność: B ViB 00 (bj 0 ) > Vi0 (bj 00 ) Fakt, że gracz A w sytuacji ruszania się jako pierwszy wybrałby strategię inną niż ai00 (ai0 6= ai00 ) oznacza w istocie, że wartość wypłaty w przypadku ruszania się jako pierwszy (VjA00 (ai0 )) jest dla niego – poza przypadkami niejednoznaczności – lepsza, niż w przypadku ruszania się, jako drugi. Stąd: VjA00 (ai0 ) > VjA0 (ai00 ) DODATEK A. PREFEROWANA KOLEJNOŚĆ RUCHÓW A RÓWNOWAGA NASHA I MODEL GRY STACKELBERGA 68 Twierdzenie A.1.2 Poza przypadkami niejednoznaczności – korzystnym dla gracza A jest ruszyć się jako drugi wtedy i tylko wtedy, gdy korzystnym by ruszyć się jako drugi jest również dla gracza B. B VjA00 (ai0 ) < VjA0 (ai00 ) ⇐⇒ ViB 00 (bj 0 ) < Vi0 (bj 00 ) Dowód. Dowód analogiczny jak w przypadku twierdzenia A.1.1. A zatem przy założeniu, że obaj gracze znają swoje macierze wypłat2 oraz cel, do jakiego zmierzają, wprowadzić można następujące definicje: Definicja A.1.2 Gra z preferencją pierwszego to gra, w której w sytuacji, gdy obaj gracze znają nawzajem swoje macierze wypłat i cel do jakiego dążą, korzystnie dla obu jest ruszyć się jako pierwszy. Definicja A.1.3 Gra z preferencją drugiego to gra, w której w sytuacji, gdy obaj gracze znają nawzajem swoje macierze wypłat i cel do jakiego dążą, korzystnie dla obu jest ruszyć się jako drugi. W powyższych definicjach systematycznie czynione było założenie braku niejednoznaczności strategii graczy. W istocie zachodzić może przypadek, gdy dla jednego z graczy nie ma znaczenia, którą z rozważanych strategii wybierze, każda bowiem dawała mu będzie jednakowo dobrą wartość wypłaty. Będzie tak dla przykładu w grze z macierzą wypłat jak w tabeli A.5. W Tabela A.5: Macierz wypłat w grze pojedynczej z jednostronną preferencją drugiego. b1 b2 a1 [2, 2] [3, 2] a2 [3, 2] [2, 2] przypadku tej gry strategie b1 i b2 są dla gracza B niejednoznaczne. Niezależnie od tego, jaką strategię wybierze gracz A gracz B i tak otrzyma wypłatę równą 2. Kolejność ruchów nie ma więc dla niego znaczenia. Ma natomiast znaczenie dla gracza A. Ruszając się jako pierwszy, niezależnie od tego, którą ze strategii ai gracz A wybierze, jego wypłata może przyjąć wartość 2 W przypadku gdy jeden z graczy nie zna macierzy wypłat drugiego gracza twierdzenia A.1.1 i A.1.2 nie muszą być prawdziwe [42]. A.1. PREFEROWANA KOLEJNOŚĆ RUCHÓW W GRZE POJEDYNCZEJ 69 tak zarówno 2, jak i 3. W interesie więc gracza A jest więc ruszyć się jako drugi. Jeśli gracz B wybrałby strategię b1 gracz B odpowiedziałby strategią a2 , jeśli natomiast gracz B wybrałby strategię b2 gracz A odpowiedziałby strategią a1 . W obu przypadkach gracz A otrzyma wypłatę równą 3. Wprowadzić można zatem następującą definicję. Definicja A.1.4 Gra z jednostronną preferencją drugiego to gra, w której w sytuacji, gdy obaj gracze znają nawzajem swoje macierze wypłat i cel do jakiego dążą, dla jednego z graczy korzystnie jest ruszyć się jako drugi, dla drugiego zaś kolejność ruchów nie ma znaczenia. Warto zauważyć, iż nie ma sensu wprowadzanie pojęcia gry z jednostronną preferencją pierwszego. Gra taka musiałaby być zdefiniowana jako gra, w której w sytuacji, gdy obaj gracze znają nawzajem swoje macierze wypłat i cel do jakiego dążą, dla jednego z graczy korzystnie jest ruszyć się jako pierwszy, dla drugiego zaś kolejność ruchów nie ma znaczenia. O korzyści z ruchu jako pierwszy jest sens mówić wówczas, gdy z punktu widzenia danego gracza warto uprzedzić ruch drugiego gracza, by w ten sposób „wymusić” na nim korzystną dla siebie odpowiedź. Założenie, że dla drugiego gracza kolejność ruchów nie ma znaczenia równoznaczne jest ze stwierdzeniem, że nic wymusić się nie da, a więc wyprzedzenie jego decyzji nie ma specjalnego sensu. Dlatego też w twierdzeniu A.1.1 nie pojawia się zwrot warunkowy „poza przypadkami niejednoznaczności”, który zawarto w twierdzeniu A.1.2. Warto również zauważyć, iż identyczność wartości wypłat danego gracza dla dwóch różnych strategii nie gwarantuje ich niejednoznaczności. Kwestia ta jest zależna od tego, jakie wartości dla tych strategii przyjmują wypłaty drugiego gracza oraz od kolejności ruchów graczy.Dla przykładu w grze z macierzą wypłat jak w tabeli A.6 strategie b1 i b2 gracza B posiadają identyczne wartości wypłat gracza B dla wszystkich strategii gracza A. Nie są one jednak niejednoznaczne wówczas, gdy gracz B musiałby się ruszyć jako pierwszy. Jeśli w takiej sytuacji gracz B wybrałby strategię b1 , wówczas odpowiedzią gracza A byłaby strategia a2 , co dało by wynik [3, 3]. Jeśli gracz B wybrałby strategię b2 , wówczas odpowiedzią gracza A byłaby strategia a1 , co dałoby wynik [3, 2]. Dla gracza B nie jest więc bez znaczenia, którą ze strategii bj wybierze. Zależność ta nie będzie jednak już zachodzić wówczas, gdy gracz B ruszał się będzie jako drugi. Wówczas obie strategie będą dla gracza B tak samo atrakcyjne, a więc niejednoznaczne. Dla odmiany możliwy jest również przypadek, kiedy to strategie o różnych wartościach wypłat dla gracza B będą dla niego niejednoznaczne. Zachodzić tak może jedynie wówczas, gdy gracz B będzie wykonywał ruch jako pierwszy. Dla przykładu w grze z macierzą wypłat jak w tabeli A.7 w sytuacji gdy gracz B musi wykonać ruch jako pierwszy nie ma dla niego znaczenia, którą ze strategii bj wybierze, w obu bowiem przypadkach może się spodziewać wypłaty równiej 70 DODATEK A. PREFEROWANA KOLEJNOŚĆ RUCHÓW A RÓWNOWAGA NASHA I MODEL GRY STACKELBERGA Tabela A.6: Macierz wypłat w grze, w której mimo identyczności wypłat gracza B dla strategii b1 i b2 nie są one niejednoznaczne. b1 b2 a1 [2, 2] [3, 2] a2 [3, 3] [2, 3] ViB (bj ) = 3: na strategię b1 gracz A odpowie strategią a2 , natomiast na strategię b2 odpowie strategią a1 , co doprowadzi odpowienio do wyników [3, 3] albo [2, 3]. Tabela A.7: Macierz wypłat w grze, w której mimo różnych wartości wypłat dla strategii gracza B, strategie te są niejednoznaczne wówczas, gdy gracz B wykonuje ruch jako pierwszy. b1 b2 a1 [1, 2] [2, 3] a2 [3, 3] [2, 1] W przypadku gdy gracz B wykonuje ruch jako drugi z niejednoznacznością strategii będziemy mieli do czynienia jedynie wówczas, gdy dla planowanej do wybrania przez gracza A strategii ai , wartości wypłat gracza B dla niejednoznacznych strategii są identyczne. Gdyby tak nie było, gracz B wybrałby strategię dającą mu większą wartość wypłaty, co przeczy założonej niejednoznaczności. Wprowadzić można ponadto definicję gry bez preferencji ruchów. Definicja A.1.5 Gra bez preferencji ruchów to gra, w której kolejność ruchów dla żadnego z graczy nie ma znaczenia. Dla przykładu gra z macierzą wypłat jak w tabeli A.8 jest grą bez preferencji ruchów. Niezależnie od tego, kto wykonywał będzie ruch jako pierwszy spodziewanym rezultatem gry będzie wynik [3, 3]. A.2. PREFEROWANA KOLEJNOŚĆ RUCHÓW A RÓWNOWAGA NASHA 71 Tabela A.8: Macierz wypłat w grze bez preferencji ruchów. A.2 b1 b2 a1 [1, 2] [2, 1] a2 [3, 3] [2, 1] Preferowana kolejność ruchów a równowaga Nasha Równowaga Nasha zdefiniowana jest [83] jako taki wynik gry, w którym żadnemu z graczy – przy założeniu że drugi gracz utrzyma swoją aktualna strategię – nie opłaca się zmieniać swojej strategii gry. W sposób formalny, dla gry w postaci normalnej [98] rozwiązanie równowagowe określa się jako taką łączną decyzję x∗ ∈ X0 (X0 - zbiór decyzji dopuszczalnych), że: fi (x∗1 , . . . x∗i , . . . x∗n ) fi (x∗1 , . . . xi , . . . x∗n ), ∀x ∈ X0 , ∀i = 1, . . . n Przy założeniu różniczkowalności funkcji wypłaty fi (x) wynika stąd układ poniższych warunków koniecznych: ∂fi (x∗ ) = 0, ∀i = 1, . . . n ∂xi Zgodnie z przyjętą w pracy konwencją oznaczeń otrzymujemy: x1 = ai , x2 = bj , f1 (x1 , x2 ) = VjA (ai ), f2 (x1 , x2 ) = ViB (bj ). Charakterystyczną cechą gry z macierzą wypłat jak w tabeli A.3 jest fakt, iż posiada ona dwie równowagi Nasha: korzystniejszą dla gracza A równowagę [3, 2] oraz korzystniejszą dla gracza B równowagę [2, 3]. Jest to gra z preferencją pierwszego, w której każdy z graczy dąży do uzyskania innego rozwiązania równowagowego. Nie jest to jednakże ogólna zasada dla gier, w których gracze chcą wykonać ruch jako pierwszy. Dla przykładu w grze z macierzą wypłat jak w tabeli A.9 jest tylko jedno rozwiązanie równowagowe [2, 3], jednakże w interesie obu graczy jest wykonanie ruchu jako pierwszy. Gracz A chciałby jako pierwszy wybrać strategię a1 , co w wyniku odpowiedzi b1 gracza B dałoby wynik [3, 2], nie bądący rozwiązaniem równowagowym: przy założeniu ustalonej strategii b1 gracz A nie wybrałby strategii a1 tylko a2 , co dałoby graczowi A DODATEK A. PREFEROWANA KOLEJNOŚĆ RUCHÓW A RÓWNOWAGA NASHA I MODEL GRY STACKELBERGA 72 korzystniejszy niż [3, 2] wynik [4, 1]. Jednakże na strategię a2 gracz B odpowiedziałby strategią b2 . Gracz B natomiast chciałby jako pierwszy wybrać strategię b2 , co w wyniku odpowiedzi a2 gracza A dałoby wynik [2, 3], będący rozwiązaniem równowagowym: Tabela A.9: Macierz wypłat w grze z preferencją pierwszego, w której jest tylko jedno rozwiązanie równowagowe. b1 b2 a1 [3, 2] [1, 1] a2 [4, 1] [2, 3] Możliwa jest jednak również sytuacja, w której gra z preferencją pierwszego nie ma wcale rozwiązania równowagowego3 , jak to dla przykładu mamy w grze z macierzą wypłat jak w tabeli A.10. W tej grze obaj gracze chcą ruszyć się jako pierwszy: gracz A wybierając strategię a1 , co na skutek odpowiedzi b1 dałoby wynik [4, 2], gracz B wybierając strategię b2 , co na skutek odpowiedzi a2 dałoby wynik [2, 3]. Żadne z tych rozwiązań nie jest rozwiązaniem równowagowym. Dla ustalonej strategii ai = a1 gracz B wybierze strategię b1 , co da wynik [4, 2]. Jednak, jeśli gracz A miałby pewność, że gracz B odpowie strategią b1 , wybrałby strategię a2 , co dałoby korzystniejszy dla A wynik [5, 1]. Analogicznie, dla ustalonej strategii bj = b2 gracz A wybierze strategię a3 , co da wynik [2, 3]. Jednak, jeśli gracz B miałby pewność, że gracz A odpowie strategią a3 , wybrałby strategię b1 , co dałoby korzystniejszy dla B wynik [2, 4]. Tabela A.10: Macierz wypłat w grze z preferencją pierwszego, w której nie ma rozwiązania równowagowego. b1 b2 a1 [4, 2] [1, 1] a2 [5, 1] [1, 1] a3 [2, 4] [2, 3] Charakterystyczną cechą gry z macierzą wypłat jak w tabeli A.4, która jak to wykazano 3 Bierze się tu pod uwagę jedynie tzw. strategie czyste – gracz może wybrać tylko jedną strategię. Nie rozważa się tu przypadku strategii mieszanych, w które polegają na możliwości wyboru kilku strategii z różnym prawdopodobieństwem [83]. A.2. PREFEROWANA KOLEJNOŚĆ RUCHÓW A RÓWNOWAGA NASHA 73 jest grą z preferencją drugiego, jest brak rozwiązania równowagowego. Nie jest to jednak właściwość ogólna. Istnieją bowiem również gry z preferencją drugiego, które posiadają rozwiązania równowagowe. Będzie tak dla przykładu w grze z macierzą wypłat jak w tabeli A.11. W tej grze wynik [2, 2] jest rozwiązaniem równowagowym: dla ustalonej strategii ai = a3 gracz B wybierze strategię b3 ; dla ustalonej strategii bj = b3 gracz A wybierze strategię a3 . Nie jest to jednakże rozwiązanie efektywne. W istocie obaj gracze liczą na to, że będą mogli wykonać ruch jako drugi, a drugi gracz nie wybierze strategii prowadzącej do wyniku [2, 2]. Jeśli pierwszy ruszy się gracz A i wybierze strategię a1 lub a2 , gracz B może doprowadzić do wyniku [3, 4], wybierając strategię b1 w odpowiedzi na strategię a1 lub b2 w odpowiedzi na strategię a2 . Analogicznej korzyści (wyniku [4, 3]) może się spodziewać gracz A, jeśli pierwszy wykona ruch gracz B. W interesie obu graczy jest więc wykonać ruch jako drugi, a żaden z nich nie jest zainteresowany rozwiązaniem równowagowym. Tabela A.11: Macierz wypłat w grze pojedynczej z preferencją drugiego, w której istnieje rozwiązanie równowagowe. b1 b2 b3 a1 [3, 4] [4, 3] [1, 1] a2 [4, 3] [3, 4] [1, 1] a2 [1, 1] [1, 1] [2, 2] W kontekście gry z rozwiązaniem równowagowym, którego wybór leży w interesie jednego z graczy sformułować można następujące twierdzenie: Twierdzenie A.2.1 Jeśli w danej grze w interesie jednego z graczy będzie wybór rozwiązania równowagowego, to jest to albo gra z preferencją pierwszego, albo gra bez preferencji ruchów. Z sytuacją gry z preferencją pierwszego będziemy mieli do czynienia wówczas, gdy drugi gracz dążył będzie do osiągniecia innego wyniku (równowagowego, jak to było w grze z macierzą wypłat jak w tabeli A.3, lub nie równowagowego, jak to było w grze z macierzą wypłat jak w tabeli A.10). Z sytuacją gry bez preferencji ruchów, będziemy mieli do czynienia wówczas, gdy w interesie obu graczy jest osiągniecie tego samego wyniku. W szczególności nie możliwa jest sytuacja, w której taka gra będzie grą z preferencją drugiego, czy z jednostronną preferencją drugiego. DODATEK A. PREFEROWANA KOLEJNOŚĆ RUCHÓW A RÓWNOWAGA NASHA I MODEL GRY STACKELBERGA 74 Dowód. strategie Z definicji rozwiązania równowagowego wynika, że jeśli do rozwiązania tego prowadzą a∗i i b∗j , to graczom nie opłaca się zmieniać swojej strategii, jeśli mają pewność, że drugi gracz swojej nie zmieni. Z założenia, że w interesie danego gracza – np. A – jest osiągnięcie rozwiązania równowagowego, do którego prowadzi wybór strategii a∗i i b∗j wynika, (po pierwsze) że gracz ten (ruszając się jako drugi) nie wybierze innej strategii ai 6= a∗i jako odpowiedzi na strategię b∗j , jak również (po drugie), że nie jest w jego interesie, by gracz B wybrał strategię inną niż b∗j . Gracz A nie może więc odnieść korzyści z tego, że wykonywał będzie ruch jako drugi. Nie może też takiej korzyści odnieść gracz B, bowiem stałoby to w sprzeczności z definicją rozwiązania równowagowego. Z definicji tej wynika bowiem, że w odpowiedzi na strategię a∗i gracz B nie odniesie korzyści wybierając strategię inną niż b∗j , co byłoby konieczne, aby rozpatrywana gra była grą z jednostronną preferencją drugiego. Rozwiązanie jest rozwiązaniem równowagowym właśnie dlatego, że każdemu z graczy (a więc również graczowi B) opłaca się wybrać strategię prowadzącą do niego (b∗j ), jeśli drugi gracz wybrał strategię (a∗i ), która osiągnięcie tego rozwiązania umożliwia. A.3 Preferowana kolejność ruchów a model gry Stackelberga W literaturze teorii gier [2, 5, 15, 20, 57, 54, 91, 94] od dawna funkcjonuje pojęcie gry Stackelberga, od nazwiska niemieckiego ekonomisty Heinricha Freiherra von Stackelberga, który jako jeden z pierwszych badał gry, w których gracze wykonują ruchy sekwencyjnie4 . W klasycznym modelu Stackelberga gracz, który wykonuje ruch jako pierwszy określany jest jako leader, natomiast gracz wykonujący ruch jako drugi jako follower. Model opisuje zjawisko konkurencji duopolistycznej, w której leader zna potencjalną odpowiedź follower’a, a przy tym obaj gracze podejmują decyzje o charakterze ilościowym5 dotyczącą planowanej wielkości produkcji, przy określonym poziomie popytu. W modelu gry Stackelberga leader jest zawsze w uprzywilejowanej pozycji (first mover adventage), mając możliwość ustalenia takiej wielkości produkcji, która umożliwi mu uzyskanie większego udziału w rynku względem follower’a, którego (racjonalna) odpowiedź jest niejako wymuszona, przez pierwotną decyzję leader’a. Formalnie zapisać to można w następujący sposób. Niech xL i xF oznaczają planowane wielkości produkcji odpowiednio gracza A (leader’a) i gracza B (follower’a). fL (xL , xF ) oraz fF (xL , xF ) oznaczają udziały w rynku, jakie gracze uzyskują w efekcie ustalenia wielkości produkcji na poziomach xL i xF . Gracz A, leader wie, że w rezultacie ustalenia przez niego wielkości produkcji na poziomie xL gracz B ustali w odpowiedzi taką wielkość produkcji xF = rF (xL ), 4 5 Swój model gry sekwencyjnej Stackelberg opublikował 1934 roku w pracy Marktform und Gleichgewicht. Konkurencję o charakterze cenowym opisuje tzw. model Bertranda. 75 A.3. PREFEROWANA KOLEJNOŚĆ RUCHÓW A MODEL GRY STACKELBERGA dla której funkcja udziału w rynku follower’a – fF (xL , xF ) przyjmie wartość maksymalną. max fF (xL , xF ) = fF (xL , rF (xL )) xF (A.1) rF (xL ) oznacza tu tzw. funkcję reakcji follower’a na określoną decyzję xL leader’a. Wiedząc, jaki charakter będzie miała odpowiedź follower’a (znając jego funkcję reakcji rF (.)) leader ustala taką wartość produkcji xL , która z uzwględnieniem odpowiedzi follower’a zmaksymalizuje jego udział w rynku. x∗L = arg max fF (xL , rF (xL )) xL (A.2) Przewaga leader’a bywa interpretowana, jako przewaga o charakterze informacyjnym: leader wie, jaki charakter będzie miała odpowiedź followera i ma możliwość przekazania informacji o podjętej przez siebie decyzji, lub też możliwość złożenia nieodwołalnego zobowiązania do wykonania określonego ruchu6 . Przy takiej interpretacji leader de facto nie musi wykonywać ruchu jako pierwszy, a jedynie złożyć nieodwołalną i wiarygodną deklarację wybrania określonej strategii. Wówczas ruch follower’a, będący w istocie pierwszym ruchem w grze musi być uzależniony od deklarowanego ruchu leader’a. Na gruncie tej interpretacji zrodziła się rodzina gier określanych mianem odwrotnych gier Stackelberga (Inverse Stackelberg Games) [68, 69, 91]. W odwrotnej grze Stackelberga to follower wykonuje ruch jako pierwszy, natomiast leader ma możliwość przekazania mu informacji na temat tego, jaka będzie jego odpowiedź na określony ruch follower’a – rL (xF ). W oparciu o tę informację follower wybiera taką wielkość produkcji xF , która maksymalizuje jego udział w rynku: x∗F = arg max fF (rL (xF ), xF ) xF (A.3) ∗ (x ). Problem decyzyjny leader’a sprowadza się tu do wyboru optymalnej funkcji reakcji rL F Symbolicznie ująć to można w formie poniższego zadania optymalizacji: ∗ rL (.) = arg max fL (rL (x∗F ), x∗F ) rL (.) (A.4) Abstrachując od charakteru podejmowanych decyzji (ilościowych czy cenowych) stwierdzić należy, iż analizowane tu gry z preferencją pierwszego (np. przykład A.3) stanowią adekwatną ilustrację modelu gry Stackelberga, kiedy to wykonujący ruch jako pierwszy leader odnosi z tego faktu korzyść. Jednakże z racji na asymetrię informacyjną nie można w ogólności powiedzieć, 6 Osobnym problemem staje się tu wiarygodność przekazanych przez leader’a informacji z punktu widzenia follower’a, czy też w ogóle możliwość odbioru takich informacji. W przypadku, gdy follower nie odbiera lub nie uwzględnia informacji o wykonanym przez leader’a ruchu (czy też nieodwołalnym zobowiązaniu do jego wykonania), jego odpowiedź może być dla leader’a zaskoczeniem, a do opisu sytuacji bardziej trafnym staje się wówczas model Cournot’a, w którym gracze wykonuję ruchy jednocześnie [61] . DODATEK A. PREFEROWANA KOLEJNOŚĆ RUCHÓW A RÓWNOWAGA NASHA I MODEL GRY STACKELBERGA 76 że follower skorzystałby w tej grze na wykonywaniu ruchu jako pierwszy. Leader jest tu w o tyle lepszej sytuacji, że zna funkcję reakcji rF (xl ) follower’a, co w istocie oznacza znajomość jego macierzy wypłat i celu do jakiego zmierza (indywidualnie efektywny, lub antagonistyczny)7 . Natomiast nie znając funkcji reakcji leader’a rL (xF ) follower w istocie rozgrywałby grę przeciwko naturze, a to oznacza, że bardziej opłacałoby mu się wykonywać ruch jako drugi, kiedy to będzie już znał decyzję xL leader’a [46, 51]. Natomiast model odwrotnej gry Stackelberga stanowi adekwatną ilustrację gry z preferencją drugiego (np. przykład A.4) i to dla obu graczy. Jeśli w grze tej opłaca się leader’owi wykonać ruch jako drugi i przekazać follower’owi jedynie charakter swojej odpowiedzi (funkcję reakcji rL (xF ) nie zaś rzeczywistą funkcję wypłaty fL (xL , xF )), umożliwiającą mu w ten sposób wpływanie na ruch follower’a, to na mocy twierdzenia A.1.2 oznacza to, że korzystniej również dla follower’a będzie wykonać ruch jako drugi. Warto jednakże zauważyć, iż model odwrotnej gry Stackelberga nie utożsamia się w sposób prosty z grą z preferencją drugiego. W istocie konieczność wykonania ruchu jako drugi może być dana niezależnie, czy jest to sytuacja korzystna dla danego gracza, czy nie [53]. I tak, dla przykładu leader może być zmuszony wykonywać ruch jako drugi w grze, w której wolałby móc wykonywać ruch jako pierwszy (zmuszony do wykonania ruchu jako drugi w grze z preferencją pierwszego). I tu już do analizy jego sytuacji decyzyjnej właściwym będzie model odwrotnej gry Stackelberga. W istocie rzeczy pierwszym pytaniem, na które posiadający przewagę informacyjną leader musi odpowiedzieć, jest to w jaką grę bardziej opłaca mu się grać: w grę Stackelberga, czy w odwrotną grę Stackelberga, czyli czy wykonać ruch jako pierwszy, czy jako drugi. Odpowiedź na to pytanie uzależniona jest z jednej strony od struktury macierzy wypłat graczy i tego, czy definiują one grę z preferencją pierwszego, czy grę z preferencją drugiego, z drugiej zaś strony od tego, czy follower posiadający jedynie informację na temat własnej funkcji wypłaty fF (.) oraz albo informację na temat decyzji leader’a – xL (model gry Stackelberga) albo jego funkcji reakcji rL (xF ), uzna tę informację (w szczególnym przypadku deklarację leader’a) za wiarygodną. Możliwe bowiem są przypadki, kiedy to w grze z preferencją pierwszego, przy założeniu przewagi informacyjnej leader’a korzytniej będzie dla niego wykonać ruch jako drugi. Będzie tak wówczas, kiedy follower, pozbawiony informacji na temat macierzy wypłat leader’a – czyli rozgrywający w istocie grę przeciwko naturze – wybierze strategię (dobrze uzasadnioną z punktu 7 Zakład się tu, że funkcja reakcji folower’a jest rezultatem znajomości przez leader’a jego macierzy wypłat i celu, do jakiego zmierza. Pomija się natomiast przypadek, kiedy to follower (na wzór leader’a w odwrotnej grze Stackelberga) przekazuje leader’owi informację na temat swojej funkcji reakcji, nie odsłaniając rzeczywistej macierzy wypłat, ani motywu (celu do jakiego zmierza), który stoi u korzania transformacji tej macierzy w funkcję reakcji. A.3. PREFEROWANA KOLEJNOŚĆ RUCHÓW A MODEL GRY STACKELBERGA 77 widzenia gry przeciwko naturze), która będzie dla leader’a korzystniejsza, niż gdyby ten miał wykonać ruch jako pierwszy, a strategia follower’a byłaby na ten ruch odpowiedzią. Przykład A.1 Macierz wypłat dla graczy A i B przedstawia się jak w tabeli A.128 . Jest to gra z preferencją pierwszego. W sytuacji, gdy obaj gracze znają swoje macierze wypłat obaj chcieliby wykonać ruch jako pierwszy (przy założeniu, że gracze dążą do celu indywidualnie efektywnego). Gracz A wybrałby wówczas strategię a2 , co w rezultacie odpowiedzi b2 ustaliłoby korzystniejszy dla A wynik [3, 2], natomiast gdyby pierwszy wykonał ruch gracz B wybrałby strategię b3 , co w rezultacie odpowiedzi a1 ustaliłoby korzystniejszy dla B wynik [2, 3]. Tabela A.12: Ilustracja przypadku, gdy graczowi A opłaca się ruszyć jako pierwszy, gdy gracz B zna jego macierz wypłat i jako drugi, gdy gracz B nie zna jego macierzy wypłat. b1 b2 b3 a1 [4,1] [1,1] [2,3] a2 [0,1] [3,2] [1,1] a3 [0,3] [1,0] [1,0] Jednakże w sytuacji, gdy gracz B nie znałby macierzy wypłat gracza A (gra w grę przeciwko naturze) i byłby zmuszony do ruszania się jako pierwszy, decyzję odnośnie wyboru strategi oparłby wyłącznie na analizie własnej macierzy wypłat, korzystając z różnych kryteriów wyboru strategii w grach przeciwko naturze [48, 47, 66, 83, 102]. W zaprezentowanym przykładzie wektor wypłat gracza B, odpowiadający strategii b1 z dokładnościa do uporządkowania składowych dominuje wektory wypłat dla strategii b2 i b3 . W związku z tym wszystkie racjonalne kryteria wyboru strategii wskażą, jako najlepszą w ich sensie strategię b1 . Należy się wiec spodziewać, że gracz B, nie znając macierzy wypłat gracza A, a co się z tym wiąże potencjalnych jego odpowiedzi, wybierze właśnie tą strategię. W tej sytuacji gracz A odpowiedziałby strategią a1 , uzyskując w ten sposób najkorzystniejszy dla siebie wynki [4, 1]. 8 Przykład zaczerpnięty z innego ([51]) artykułu Autora. DODATEK A. PREFEROWANA KOLEJNOŚĆ RUCHÓW A RÓWNOWAGA NASHA I MODEL GRY STACKELBERGA 78 A.4 Wnioski Z przeprowadzonych analiz wynikają następujące stwierdzenia: • Jeśli w danej grze pojedynczej obaj gracze posiadają określone preferencje odnośnie kolejności wykonywania ruchów, to są to zawsze preferencje przeciwstawne: albo obaj chcieliby wykonać ruch jako pierwszy, albo obaj jako drugi; • Jeśli w danej grze pojedynczej tylko jeden z graczy posiada preferencje odnośnie kolejności wykonywania ruchów (dla drugiego kolejność ruchów nie ma znaczenia), to jest to preferencja, by wykonywać ruch jako drugi; • Niejednoznacznymi (jak i jednoznacznymi) strategiami mogą być tak zarówno strategie, którym odpowiadają zarówno jednakowe jak i niejednakowe wektory wypłat danego gracza; • Nie ma bezpośredniej zależności pomiędzy faktem istnienia, bądź nieistnienia równowagi Nasha (w strategiach czystych), a preferencją ruchów w grze pojedynczej; • Jeśli w danej grze w interesie jednego z graczy będzie wybór rozwiązania równowagowego, to jest to albo gra z preferencją pierwszego, albo gra bez preferencji ruchów; • Gry z preferencją pierwszego stanowią adekwatną ilustrację modelu gry Stackelberga, jednakże z racji na asymetrię informacyjną, zakładaną w tym modelu gry nie można w ogólności powiedzieć, że follower skorzystałby w tej grze na wykonaniu ruchu jako pierwszy; • Gry z preferencją drugiego stanowią adektwatną ilustrację modelu odwrotnej gry Stackelberga, w której zarówno leader’owi jak i follower’owi opłacałoby się wykonać ruch jako drugi; • Kluczową kwestią dla posiadającego przewagę informacyjną leader’a jest odpowiedź na pytanie o najbardziej korzystną dla niego kolejność ruchów, czyli wybór gry (gry Stackelberga lub odwrotnej gry Stackelberga), w którą będzie grał; • Istnieją gry z preferencją pierwszego, w której z racji na ograniczenia informacyjne follower’a opłaca się leader’owi wykonać ruch jako drugi. Dodatek B Narzędzia wspomagania decyzji w warunkach niepewności i ryzyka B.1 Narzędzia wspomagania decyzji w warunkach niepewności - kryteria wyboru strategii w grze przeciwko naturze W niniejszym dodatku przedstawiono znane z literatury [14, 65, 66, 83, 102], jak również autorskie [41] kryteria wyboru strategii w grach przeciwko naturze. Kryteria te stanowią właściwe narzędzia wspomagania decyzji w sytuacji niepewnośći B.1.1 Kryterium Walda Jest to procedura wyboru strategii, charakteryzująca się największą awersją do ryzyka. Zakłada, iż zdarzy się sytuacja najbardziej niekorzystna (gracz B wybierze taką strategię, która dla danej strategii gracza A da temuż wypłatę najgorszą z możliwych) i w takich warunkach określana jest najlepsza strategia (gracza A). Jest to tak zwana strategia maxminowa. Dla każdej z własnych strategii określana jest najgorsza (tu najmniejsza) z możliwych wypłat, a następnie wybierana jest ta strategia, która tę wypłatę maksymalizuje. Jeśli przyjmiemy następujące oznaczenie: VjA (ai ) - wielkość wypłaty dla gracza A, gdy wybrał on strategię ai , a gracz B wybrał strategię bj , wówczas kryterium Walda definiuje następujące zadanie optymalizacji: max{min VjA (ai ) : i ∈ IA }. j 79 (B.1) 80 DODATEK B. NARZĘDZIA WSPOMAGANIA DECYZJI W WARUNKACH NIEPEWNOŚCI I RYZYKA Kryterium Walda sformułowane w postaci (B.1), którą nazwiemy postacią szczególną, może prowadzić do niejednoznaczności rozwiązania, tzn., nie wyłoni jednej strategii najlepszej w sensie tego kryterium, lecz ich zbiór, mimo że któraś z nich będzie wyraźnie lepsza. Dlatego też użytecznym może być sformułowanie kryterium Walda w postaci ogólnej. Zasada będzie tu następująca. Dla potrzeb sformułowania kryterium Walda w postaci ogólnej wprowadzimy przekształcenie porządkujące Θ(x), spełniające zależność θ1 (x) ¬ θ2 (x) ¬ ... ¬ θJ (x), (B.2) gdzie J oznacza liczbę składowych wektora x. Przekształcenie to porządkuje elementy składowe wektora x w kolejności od najmniejszego do największego. Korzystając z przekształcenia θ, kryterium Walda w postaci ogólnej wyrazimy zależnością lexmax{θ1 (VA (ai )), θ2 (VA (ai )), ...θm (VA (ai )) : i ∈ IA }. (B.3) Gdzie VA (ai ) jest wektorem wypłat dla strategii i gracza A. B.1.2 Kryterium optymistyczne Jest to procedura wyboru strategii, charakteryzująca się największym optymizmem. Zakłada, iż zdarzy się sytuacja najbardziej korzystna (gracz B wybierze taką strategię, która dla danej strategii gracza A da temuż wypłatę najlepszą z możliwych) i w takich warunkach określana jest najlepsza strategia (gracza A). Dla każdej z własnych strategii określana jest najlepsza (tu największa) z możliwych wypłat, a następnie wybierana jest ta strategia, która tę wypłatę maksymalizuje. Kryterium optymistyczne zdefiniowane jest przez następujące zadanie optymalizacji: max{max VjA (ai ) : i ∈ IA }. j (B.4) W sformułowaniu ogólnym kryterium optymistyczne zdefiniowane będzie poniższym zadaniem optymalizacji leksykograficznej lexmax{θJ (V(ai )), θJ−1 (V(ai )), ...θ1 (V(ai )) : i ∈ IA }. B.1.3 (B.5) Kryterium Hurwicza Kryterium Hurwicza jest uogólnioną postacią kryteriów Walda i optymistycznego. Bierze się tu pod uwagę tak zarówno wypłatę najlepszą (największą) z możliwych, jak i najgorszą (najmniejszą). Dla wyrażenia wagi zainteresowania wypłatą najlepszą i najgorszą wprowadza się tzw. współczynnik optymizmu - α. B.1. NARZĘDZIA WSPOMAGANIA DECYZJI W WARUNKACH NIEPEWNOŚCI - KRYTERIA WYBORU STRATEGII W GRZE PRZECIWKO NATURZE 81 Kryterium Hurwicza (w postaci szczególnej) zdefiniowane jest przez następujące zadanie optymalizacji: max{α · max VjA (ai ) + (1 − α) · min VjA (ai ) : i ∈ IA }. j j (B.6) Sformułowanie ogólne wymaga rozpatrzenia dwóch przypadków: parzystej i nieparzystej liczby strategii gracza B. Przyjmiemy następujące oznaczenia. WJ = α · θJ (VA (ai )) + (1 − α) · θ1 (VA (ai )) WJ−1 = α · θJ−1 (VA (ai )) + (1 − α) · θ2 (VA (ai )) WJ−2 = α · θJ−2 (VA (ai )) + (1 − α) · θ3 (VA (ai )) ... Dla parzystej liczby strategii gracza B ostatnim elementem będzie WJ− J +1 = α · θJ− J +1 (VA (ai )) + (1 − α) · θ J (VA (ai )) 2 2 2 a dla nieparzystej liczby strategii: WJ− J−1 = α · θJ− J−1 (VA (ai )) + (1 − α) · θ J+1 (VA (ai )) = θJ− J−1 (VA (ai )) 2 2 2 2 Wówczas ogólnie dla parzystej liczby strategii gracza B kryterium Hurwicza definiujemy jako następujące zadanie optymalizacji leksykograficznej: lexmax{WJ , WJ−1 , ..., WJ− J +1 : i ∈ IA }, (B.7) 2 natomiast dla nieparzystej liczby strategii gracza B lexmax{WJ , WJ−1 , ..., WJ− J−1 : i ∈ IA }. (B.8) 2 B.1.4 Kryterium Laplace’a Jest to procedura wyboru strategii, skupiająca uwagę na wartości oczekiwanej wypłaty, jaką może uzyskać gracz (A) wybierając daną strategię. Ponieważ brak jest informacji o macierzy wypłat gracza konkurencyjnego (B), to z konieczności trzeba założyć, iż z równym prawdopodobieństwem gracz ten wybrać może każdą ze swoich strategii1 . W tym przypadku - gdy prawdopodobieństwa wyboru danych strategii przez konkurenta są jednakowe (lub z braku informacji przyjęte jako takie) - strategia maksymalizująca wartość oczekiwaną wypłaty, jest tożsama ze strategią maksymalizującą sumę (po wszystkich strategiach konkurenta) wypłat. Kryterium Laplace’a wyrazimy zależnością max{ 1 J 1X V A (ai ) : i ∈ IA }, J j=1 j Bez tego założenia byłoby to równoznaczne z tworzeniem informacji, której się nie posiada. (B.9) 82 DODATEK B. NARZĘDZIA WSPOMAGANIA DECYZJI W WARUNKACH NIEPEWNOŚCI I RYZYKA lub prościej max{ J X VjA (ai ) : i ∈ IA }. (B.10) j=1 Sformułowaniem ogólnym kryterium Laplace’a jest przypadek rozpatrywania sumy tylko kilku wybranych, największych bądź najmniejszych wypłat dla każdej strategii. I tak dla przypadku rozpatrywania sumy k największych wypłat, kryterium Laplace’a wyrazimy zależnością k−1 X max{ θJ−j (VA (ai )) : i ∈ IA }, (B.11) j=0 natomiast dla przypadku sumy k najmniejszych wypłat, zależnością: max{ k X θj (VA (ai )) : i ∈ IA }. (B.12) j=1 Warto zauważyć, iż szczególnym przypadkiem (dla k = 1) kryterium Laplace’a postaci (B.11) będzie kryterium Optymistyczne (B.4), a dla postaci (B.12) kryterium Walda (B.1). B.1.5 Kryterium Savage’a Kryterium to opiera się na obserwacji, iż w niektórych przypadkach wartość otrzymanej wypłaty ocenia się nie pod kątem jej bezwzględnej wartości, ale w porównaniu z najlepszą możliwą do osiągnięcia wypłatą, przy założeniu ustalonej strategii konkurenta. Jest to wyrazem tendencji do minimalizowania poczucia straty (utraconej korzyści). Dla każdej możliwej decyzji gracza B określa się wielkość straty - w stosunku do wartości najlepszej - jaką poniósłby gracz A wybierając daną strategię. Wartość straty gracza A (przy ustalonej strategii gracza B - j), określana jest tu jako różnica maksymalnej wypłaty Vj max , jaką otrzymać mógłby gracz A i wypłaty, jaką otrzyma wybierając strategię i. Funkcję, która każdej wartości wypłaty z macierzy wypłat przyporządkuje wartość straty, nazywali będziemy funkcją straty. Maksymalną wypłatę gracza A, przy ustalonej strategii j gracza B wyznaczyć można z zależności VjAmax = max VjA (ai ). i (B.13) Natomiast funkcja straty wyrażać się będzie zależnością VejA (ai ) = VjAmax − VjA (ai ). (B.14) Zależność (B.14) pozwala nam przekształcić oryginalną macierz wypłat na macierz strat. Kryterium Savage’a wskazuje na taką strategię, która minimalizuje maksymalną stratę. Jest to więc strategia minmaxowa dla macierzy strat min{max VejA (ai ) : i ∈ IA }. j (B.15) B.1. NARZĘDZIA WSPOMAGANIA DECYZJI W WARUNKACH NIEPEWNOŚCI - KRYTERIA WYBORU STRATEGII W GRZE PRZECIWKO NATURZE 83 Ogólnie kryterium Savage’a wyraża się zależnością e A (ai )), θJ−1 (V e A (ai )), ...θ1 (V e A (ai )) : i ∈ IA }. lexmin{θJ (V B.1.6 (B.16) Kryterium maksymalizacji liczby największych wygranych (LNW) Pod pojęciem największej wygranej rozumieli będziemy wypłatę, której w macierzy strat odpowiada wartość zerowa. Kryterium LNW stosuje się w sytuacjach, kiedy gracz dąży nie tyle do minimalizacji wartości straty, jak to było w przypadku kryterium Savage’a, lecz do minimalizacji prawdopodobieństwa, że w ogóle takiej straty się doświadczy. Innymi słowy kryterium to wskazuje na tę strategię, która zawiera najwięcej takich wartości wypłat, którym w macierzy strat odpowiada wartość zerowa. Wprowadźmy przekształcenie Φ, takie że: 1 dla x ¬ 0 Φ(x) = 0 dla x > 0 Przekształcenie Φ może być sformułowane w bardzo różny sposób. Jeden z nich ilustruje zależność Φ(x) = sign(−x) + 1 , 2 (B.17) gdzie funkcja sign(x) to funkcja signum, zwracająca wartość +1 dla x 0 oraz −1 dla x < 0. Korzystając z przekształcenia Φ możemy przedstawić kryterium LNW w postaci max{ X Φ(VejA (ai )) : i ∈ IA } (B.18) j B.1.7 Kryterium maksymalizacji liczby największych wygranych z progiem uznania (LNWP) Kryterium LNW postaci (B.18) brało pod uwagę tylko te wartości wypłat, którym w macierzy strat odpowiadała wartość zerowa, czyli w ścisłym tego słowa znaczeniu wygrane największe. W kryterium LNWP (LNW z progiem uznania), prócz wartości wypłat największych wygranych brali będziemy dodatkowo pod uwagę te wypłaty, które mimo że w danej kolumnie macierzy wypłat nie są największe, to są na tyle zbliżone do wypłat największych, że za największe skłonni jesteśmy je uznać. Zmodyfikujmy postać punkcji Φ. Dla progu bezwzględnego będzie ona miała teraz postać 1 dla x ¬ ρ Φ(x, ρ) = , 0 dla x > ρ 84 DODATEK B. NARZĘDZIA WSPOMAGANIA DECYZJI W WARUNKACH NIEPEWNOŚCI I RYZYKA natomiast dla progu względnego postać 1 dla Φ(x, ρ, xmax ) = 0 dla x xmax x xmax ¬ρ >ρ Przykładowe postaci zmodyfikowanej funkcji Φ ilustrują zależności (B.19), (B.20). sign(ρ − x) + 1 (B.19) 2 x sign(ρ − xmax )+1 Φ(x, ρ, xmax ) = (B.20) 2 Wobec powyższego kryterium maksymalizacji liczby największych wygranych LNWP z bezΦ(x, ρ) = względnym progiem uznania zdefiniujemy zależnością X max{ ·Φ(VejA (ai ), ρ) : i ∈ IA } (B.21) j natomiast kryterium maksymalizacji liczby największych wygranych LNWP ze względnym progiem uznania zależnością X max{ ·Φ(VejA (ai ), ρ, VjAmax ) : i ∈ IA } (B.22) j B.1.8 Kryterium maksymalizacji sumy największych wypłat z progiem uznania (SNWP) Istotą kryterium SNWP jest maksymalizacja sumy tych wypłat, którym w macierzy strat odpowiada wartość zerowa (największych wypłat), bądź taka, którą uznać możemy za pomijalnie małą. Motywacja gracza do wyboru danej strategii opiera się tu zatem z jednej strony na chęci unikania strat (minimalizacji prawdopodobieństwa, że ona wystąpi), a z drugiej strony na maksymalizacji wartości oczekiwanej wypłaty Jest to zatem swoista hybryda kryterium LNW i Laplace’a. Analogicznie jak dla kryterium LNWP, w kryterium SNWP przyjmiemy zatem, iż daną wypłatę uznawali będziemy za największą wygraną, jeśli jej wartość będzie mniejsza od faktycznie największej wygranej w tej samej kolumnie o wartość nie przekraczającą wartości progu uznania ρ. Korzystając z wprowadzonej już definicji funkcji Φ z bezwzględnym progiem uznania (B.19), oraz ze względnym progiem uznania (B.20), kryterium maksymalizacji sumy największych wygranych SNWP z bezwzględnym progiem uznania zdefiniujemy zależnością X max{ VjA (ai ) · Φ(VejA (ai ), ρ) : i ∈ IA } (B.23) j natomiast kryterium maksymalizacji sumy największych wygranych SNWP ze względnym progiem uznania zależnością X max{ j VjA (ai ) · Φ(VejA (ai ), ρ, VjAmax ) : i ∈ IA } (B.24) B.1. NARZĘDZIA WSPOMAGANIA DECYZJI W WARUNKACH NIEPEWNOŚCI - KRYTERIA WYBORU STRATEGII W GRZE PRZECIWKO NATURZE 85 B.1.9 Kryterium maksymalizacji wartości oczekiwanej wypłaty z progiem uznania (EWP) Idea jest tu następująca. Przyjmujemy, iż gracz w swych decyzjach kieruje się kryterium maksymalizacji wartości oczekiwanej wypłaty (kryterium Laplace’a). Nie wszystkie wartości wypłat skłonny jest on jednakże traktować jako wygraną. Zakładamy, że interesują go tylko określone wartości wypłat, większe niż pewna wartość v, i tylko te jest on w stanie akceptować jako rzeczywistą wygraną. Wypłaty mniejsze niż v nie stanowią dla gracza żadnej wartości. Po przez analogię do kryterium SNWP wartość v nazywali będziemy progiem uznania. Różnica pomiędzy progiem ρ z kryterium SNWP, a wprowadzonym tu progiem v jest taka, iż próg ρ określa minimalną wartość straty, którą jesteśmy skłonni jeszcze za stratę uważać, natomiast próg v określa minimalną wartość wypłaty, którą skłonni jeszcze jesteśmy uznać za wygraną. Wprowadźmy zatem funkcję Ψ(x, v) o następujących właściwościach: 1 dla x v Ψ(x, v) = 0 dla x < v Przykładową postać funkcji Ψ(x, v) ilustruje zależność Ψ(x, v) = sign(x − v) + 1 . 2 (B.25) Korzystając z wprowadzonej funkcji Ψ(x, v), kryterium maksymalizacji wartości oczekiwanej z progiem uznania EWP wyrazimy zależnością max{ X VjA (ai ) · Ψ(VjA (ai ), v) : i ∈ IA } (B.26) j Kryterium to jest zatem uogólnieniem kryterium wartości oczekiwanej Laplace’a. Kryterium Laplace’a otrzymujemy podstawiając za próg uznania v wartość mniejszą bądź równą najmniejszej wartości wypłaty w macierzy wypłat. B.1.10 Kryterium minimalizacji wartości oczekiwanej straty z progiem uznania (ESP) Poprzez analogię do kryterium maksymalizacji wartości oczekiwanej wypłaty z progiem uznania EWP, wprowadzimy kryterium minimalizacji wartości oczekiwanej straty z progiem uznania. Zakładamy tu, że za stratę uważamy tylko wartości większe niż próg v. Korzystając z funkcji straty, zdefiniowanej zależnością (B.14), oraz funkcji Ψ postaci (B.25), kryterium ESP wyrazimy zależnością min{ X j VejA (ai ) · Ψ(VejA (ai ), v) : i ∈ IA }. (B.27) 86 DODATEK B. NARZĘDZIA WSPOMAGANIA DECYZJI W WARUNKACH NIEPEWNOŚCI I RYZYKA Ponieważ kryterium maksymalizacji sumy wypłat (Laplace’a) jest tożsame z kryterium minimalizacji sumy strat (Expected Opportunity Loss), zatem kryterium ESP interpretować możemy jako maksymalizację sumy wypłat, dla których jest zauważalna (większa niż v) strata. Tu wyłania się subtelna różnica pomiędzy kryterium maksymalizacji sumy największych wygranych z progiem uznania SNWP, maksymalizacji wartości oczekiwanej wypłaty z progiem uznania EWP i minimalizacji wartości oczekiwanej straty z progiem uznania ESP, którą, jak to zostało powiedziane, interpretować można jako maksymalizację sumy wypłat, dla których jest zauważalna strata. Różnice nakreśla poniższe zestawienie. kryterium działanie EWP maksymalizuje sumę wypłat uznanych za wygraną ESP maksymalizuje sumę wypłat, dla których jest zauważalna strata SNWP maksymalizuje sumę wypłat, dla których strata jest niezauważalna B.1.11 Kryterium maksymalizacji progowej wartości oczekiwanej wypłaty (PEW) Kryterium maksymalizacji wartości oczekiwanej wypłaty z progiem uznania EWP (B.26) daje w szczególnym przypadku różne rozwiązania w zależności od tego, jaką przyjmie się wartość progu v. Dla przykładu, gdyby dla macierzy wypłat, jak w tabeli ?? przyjąć wartość progu uznania v równą nie 2, lecz 3, wówczas kryterium to wskazałoby już nie na strategię a2 lecz a1 , a dla v = 5, strategię a4 . Stąd pomysł stworzenia kryterium, które przy wyborze strategii brałoby pod uwagę wszelkie możliwe i sensowne wartości progów. Kryterium to jest użyteczne wówczas, kiedy gracz nie jest w stanie a priori ustalić właściwej wartości progu uznania. Przyjmijmy zatem, że wartość progu v zmieniała się będzie od wartości najmniejszej do największej - patrząc na wartości wypłat w macierzy wypłat, zgodnie z krokiem o wartości v. Kryterium maksymalizacji progowej wartości oczekiwanej wypłaty PEW zdefiniujemy wówczas zależnością XX max{ VjA (ai ) · Ψ(VjA (ai ), k · v) : i ∈ IA }. (B.28) j k W przypadku, gdyby przewidywano, iż poszczególne wartości progów k · v występować miały z prawdopodobieństwem pk , wówczas kryterium PEW można przekształcić do postaci max{ XX k B.1.12 pk · VjA (ai ) · Ψ(VjA (ai ), k · v) : i ∈ IA }. (B.29) j Kryterium minimalizacji progowej wartości oczekiwanej straty (PES) Kryterium minimalizacji wartości oczekiwanej straty z progiem uznania ESP (B.27) daje w szczególnym przypadku różne rozwiązania w zależności od tego, jaką przyjmie się wartość progu B.2. NARZĘDZIA WSPOMAGANIA DECYZJI W WARUNKACH RYZYKA 87 v. Kryterium minimalizacji progowej wartości oczekiwanej straty PES, analogicznie do kryterium maksymalizacji progowej wartości oczekiwanej wypłaty PEW rozpatruje wszelkie możliwe progi uznania, agregując - poprzez sumowanie po progach - otrzymane rozwiązania. Kryterium PES definiujemy zależnością min{ XX k VejA (ai ) · Ψ(VejA (ai ), k · v) : i ∈ IA } (B.30) j Definicja kryterium (B.30) uwzględnia próg uznania w sensie bezwzględnym, tzn. bez odniesienia do wartości maksymalnej Vj max . W przypadku operowania na macierzy strat, bardziej właściwym wydaje się odwoływanie się do progów względnych. Dlatego też proponujemy dodatkową postać kryterium PES ze względnym progiem uznania, postaci min{ XX VejA (ai ) · Ψ(VejA (ai ), k · v, VjAmax ) : i ∈ IA }. (B.31) j k Funkcja Ψ przybiera tu trzy argumenty i zdefiniowana jest zależnością Ψ(x, v, xmax ) = x sign( xmax − v) + 1 . 2 (B.32) W przypadku, gdyby przewidywano, iż poszczególne wartości progów k · v występować miały z prawdopodobieństwem pk , wówczas kryterium PES można przekształcić do postaci XX min{ k pk · VejA (ai ) · Ψ(VejA (ai ), k · v, VjAmax ) : i ∈ IA }. (B.33) j Kryterium PES, podobnie jak to było w przypadku kryterium PEW, użyteczne jest wówczas, kiedy gracz nie jest w stanie a priori ustalić właściwej wartości progu uznania. Ponadto warto zauważyć, iż mimo, że zastosowanie kryterium maksymalizacji wartości oczekiwanej wypłaty (Laplace’a) daje w wyniku zawsze tę samą strategię co kryterium minimalizacji wartości oczekiwanej straty (Expected Opportunity Loss), to w przypadku kryteriów progowych PEW i PES tak już nie jest. B.2 Narzędzia wspomagania decyzji w warunkach ryzyka Różnica pomiędzy sytuacją wyboru decyzji w warunkach niepewności a ryzyka jest taka, że określone prawdopodobieństwa (występowania określonych stanów natury, wyboru określonych strategii przez konkurentów, wybrania określonego typu jako typu aktywnego w grze – ogólnie scenariuszy) przyjmują różną wartość. Założenie, że prawdopodobieństwa te przyjmują różną wartość idzie w parze z założeniem, że są one znane, a więc, że są znane prawdoopodobieństwa pi zaistnienia poszczególnych scenariuszy yi . Klasycznym sposobem podejścia do tego typu 88 DODATEK B. NARZĘDZIA WSPOMAGANIA DECYZJI W WARUNKACH NIEPEWNOŚCI I RYZYKA sytuacji jest zamiana modelu prawdopodobieństwo-scenariusz na model logerii, w której liczaba wystąpień określonego scenariusza odpowiada wartości przypisanego mu prawdopodobieństwa. Uzyskuje się w ten sposób problem wielokryterialny. Tematyka wspomagania decyzji w warunkach ryzyka ma już swoją bogatą literaturę (zobacz np. [38]). Wypracowano też w tym względzie wiele podejść takich jak. metoda Markowitza, metoda dystrybuanty referencyjnej, agregacja OWA. Szczegółowy opis tych i innych metod znaleźć można w pracy [66]. Dodatek C John’a C. Harsanyi: Dwustronne negocjacje w sytuacji nieznajomości funkcji użyteczności kontrpartnera w grze. C.1 Próba ustalenia wartości punktu zgody W negocjacjach, a bardziej ogólnie we wszystkich nie trywialnych sytuacjach o charakterze strategicznych interakcji (sytuacje gry), zachowanie racjonalnego gracza zależy od tego, czego spodziewa się on odnośnie zachowania drugiej stron. Gracz 1 zabiega o najlepsze z możliwych warunków, o jakich akceptacji spodziewa się ze strony gracza 2. Jednakże gracz 1 wie, że warunki na jakie zgodzi się gracz 2 zależą z kolei od tego, czego gracz 2 spodziewa się od gracza 1, akceptację jakich warunków ze strony gracza 1 ma nadzieję uzyskać. Stąd zachowanie gracza 1 zależy od tego, co określić można oczekiwaniem (przypuszczeniem) drugiego rzędu (second-order expectation), tzn. zależy od przypuszczeń gracza 1 odnośnie przypuszczeń gracza 2 związanych z zachowaniem się gracza 1 (możliwych do zaakceptowania przez niego, tj. gracza 1 warunków). To z kolei zależy od oczekiwań trzeciego rzędu gracza 1 odnośnie oczekiwań drugiego rzędu gracza 2 itd. Wprowadźmy następujące oznaczenia1 . Niech A1 i A2 oznaczają punkty zgody odpowiednio gracza 1 i 2. Punkt zgody oznacza najgorsze warunki, na które dany gracz jest gotów w trakcie negocjacji się zgodzić 2 . Niech operator e1 oznacza „estymację lub przypuszczenie gracza 1 1 2 W tej części pracy przyjmujemy oryginalną notację przyjętą przez Harsanyi w pracy [28]. Harsanyi nie definiuje punktów zgody A1 i A2 jako wartości opartych na najlepszej alternatywie dostępnej 89 DODATEK C. JOHN’A C. HARSANYI: DWUSTRONNE NEGOCJACJE W SYTUACJI NIEZNAJOMOŚCI FUNKCJI UŻYTECZNOŚCI KONTRPARTNERA W GRZE. 90 odnośnie określonej wartości”. Analogicznie e2 oznacza „estymację lub przypuszczenie gracza 2 odnośnie określonej wartości”. Nasze dotychczasowe rozumowanie może być teraz wyrażone w sposób następujący. Gracz 1 wybierze swój punkt zgody A1 w oparciu o swoje przypuszczenie (estymację) odnośnie punktu zgody graca A2 . Innymi słowy A1 zależy od e1 A2 . Jednakże gracz 2 wybierze swój punkt zgody A2 w oparciu o przypuszczenie (estymację) punktu zgody gracza A1 . Stąd A2 zależy od e2 A1 . Ponieważ gracz 1 wie, że A2 zależy od e2 A1 , swoje przypuszczenie odnośnie pierwszego składnika (A2 ) oprze na przypuszczeniu odnośnie drugiego (e2 A1 ). Stąd e1 A2 zależy od e1 e2 A1 . Rozumując analogicznie stwierdzić można, że e2 A1 zależy od e2 e1 A2 . Ponieważ gracz 1 wie, że e2 A1 zależy od e2 e1 A2 , to swoje przypuszczenie (estymację) odnośnie pierwszego (e2 A1 ) znowu uzależni od swojego przypuszczenia odnośnie drugiego (e2 e1 A2 ). Stąd e1 e2 A1 będzie zależało od e1 e2 e1 A2 . Rozumując analogicznie e2 e1 A2 będzie zależało od e1 e1 e2 A1 itd. Podsumowując: A1 zależy od e1 A2 e1 A2 zależy od e1 e2 A1 e1 e2 A1 zależy od e1 e2 e1 A2 , itd3 . Stąd też analiza sytuacji decyzyjnej gracza 1 w kontekście próby ustalenia właściwej wartości punktu zgody prowadzi do nieskończonej sekwencji A1 (n) złożonych przypuszczeń, gdzie nieparzyste elementy sekwencji przyjmują postać: A1 (n) = A1 (2k − 1) = (e1 e2 )k−1 A1 , (C.1) A1 (n) = A1 (2k) = (e1 e2 )k−1 e1 A1 . (C.2) natomiast elementy parzyste: Kłopot tu tkwi jednak w tym, że każdy element tej nieskończonej sekwencji A1 (n) zależy od elementu następnego A1 (n + 1), co w oczywisty sposób prowadzi do nieskończonej regresji. poza stołem negocjacyjnym, czyli BATNA (Best Alternative To a Negotiated Agreement) graczy [18, 71, 75, 76, 92, 95], co bywa określane jako punkt rezerwacji [96, 98, 100, 101]. Wartości punktów zgody w ujęciu Harsanyi zależą jedynie od analizy sytuacji (i dostępnych rozwiązań) przy stole negocjacyjnym, a jeszcze ściślej mówiąc, od spodziewanej wartości punktu zgody kontrpartnera. 3 Odzwierciedla to następujące rozumowanie: wartość mojego (gracza 1) punktu zgody, krócej „moja wartość” zależy od twojej (gracza 2) wartości (twojego punktu zgody), a ściślej od tego, co ja o niej myślę (e1 ). Jednak twoja wartość zależy od tego co ty myślisz (e2 ) na temat mojej wartości. Czyli moje myślenie (e1 ) na temat twojej wartości zależne jest od mojego myślenia na temat tego, co ty myślisz (e1 e2 ) o mojej wartości. To z kolei, co ty myślisz (e2 ) o mojej wartości, zależne jest od tego, co myślisz, że ja myślę (e2 e1 ) o twojej wartości. Czyli moje myślenie na temat twojego myślenia (e1 e2 ) o mojej wartości, zależne jest od mojego myślenia, na temat twojego myślenia o tym, co ja myślę (e1 e2 e1 ) o twojej wartości. Itd. C.2. ARBITRAŻOWE ROZWIĄZANIE ZUETHEN’A-NASH’A W PRZYPADKU ZNAJOMOŚCI FUNKCJI UŻYTECZNOŚCI 91 Oczywiście analiza sytuacji decyzyjnej gracz 2 w kontekście próby ustalenia wartości punktu zgody A2 prowadzić będzie do podobnych wniosków. C.2 Arbitrażowe rozwiązanie Zuethen’a-Nash’a w przypadku znajomości funkcji użyteczności Jednym z istotnych osiągnięć teorii gier w ogólności, a w szczególności teorii gier negocjacyjnych (bargaining games) Zeuthen’a-Nash’a jest pokazanie, w jaki sposób wyżej omówiona nieskończona regresja skomplikowanych przypuszczeń może zostać w sposób analityczny rozwiązana. Rozwiązanie to jest osiągnięte w szczególności poprzez sformułowania pewnych warunków równowagi (equilibrium conditions) lub poprzez żądanie konwekwencji (consistency requirements), które przypuszczenia racjonalnych graczy muszą spełniać, w ramach rozważań na temat wzajemnego zachowania. W szczególności, teoria Zeuthen’a-Nash’a zakłada, że dany gracz nie będzie oczekiwał od drugiego gracza ustępstwa, na które sam by się nie zgodził. Fakt ten nakłada warunek silnej symetrii na strategie, które w sposób racjonalny mogłyby być wybrane przez każdego z graczy, oczekującego od kontrpartnera równie racjonalnego zachowania. Ten postulat symetrii, w połączeniu z kilkoma innymi bardzo naturalnymi postulatami racjonalnego zachowania4 prowadzi do wskazania jednoznacznego5 rozwiązania, będącego jednocześnie punktem równowagi (equilibrium agreement point) – A∗ , dla każdej konkretnej gry negocjacyjnej Γ. W sposób matematyczny rozwiązanie Zeuthen’a-Nash’a może być zdefiniowane w sposób następujący. Niech u1 i u2 będą funkcjami użyteczności odpowiednio gracza 1 i gracza 2. Niech C będzie rozwiązaniem dostępnym dla obu graczy w sytuacji, gdyby nie zawarli w trakcie negocjacji porozumienia. Niech A będzie zbiorem wszystkich możliwych rozwiązań A dostępnych w trakcie negocjacji. Wówczas rozwiązanie A∗ jest takim szczególnym rozwiązaniem (porozumieniem zawartym w trakcie negocjacji) A, które maksymalizuje następującą funkcję (iloczyn): π0 = π(u1 , u2 ) = [u1 (A) − u1 (c)] · [u2 (A) − u2 (C)] (C.3) z zachowaniem warunku: A∈A 4 Prócz postulatu symetrii, mowa jest tu jeszcze o postulacie racjonalności (czy pareto-optymalności), nieza- leżności od przekształceń liniowych oraz niezależności od opcji nieistotnych (czy inaczej alternatyw niezależnych) [64, 73, 83]. 5 Badania prowadzone przez innych badaczy w kwestii poszukiwania rozwiązania gry negocjacyjnej (co bywa nazywane problemem arbitrażu) pokazały, że takich rozwiązań racjonalnie i naturalnie uzasadnionych może być więcej [55, 71, 98, 101] i że nie muszą być one tożsame. DODATEK C. JOHN’A C. HARSANYI: DWUSTRONNE NEGOCJACJE W SYTUACJI NIEZNAJOMOŚCI FUNKCJI UŻYTECZNOŚCI KONTRPARTNERA W GRZE. 92 ui (A) ui (C) [i = 1, 2] Zakładając, że obaj gracze znają nawzajem swoje funkcje użyteczności, nieskończona regresja złożonych przewidywań w tym miejscu znika. Wynika to z faktu, że jeśli obaj gracze podążają za postulatami racjonalności Zeuthen’a-Nash’a, to zaakceptują i będą oczekiwali akceptacji od drugiej strony rozwiązania A∗ jako rozwiązania negocjowanego przez nich problemu. Stąd otrzymujemy: C.3 A1 = e2 A1 = e1 e2 A1 = e2 e1 e2 A1 = . . . = A∗ (C.4) A2 = e1 A2 = e2 e1 A2 = e1 e2 e1 A2 = . . . = A∗ . (C.5) Estymacja arbitrażowego rozwiązania Zeuthen’a-Nash’a w przypadku nieznajomości funkcji użyteczności Podczas gdy rozwiązanie Zeuthen’a-Nash’a stanowi rozwiązanie problemu złożonych przypuszczeń w przypadku, gdy obie strony negocjacji znają nawzajem swoje funkcje wypłaty, to problem powraca w nieco odmiennej formie wówczas, gdy rozluźnimy założenie o wzajemnie znanych funkcjach użyteczności. Przyjmijmy, że obaj gracze (negocjatorzy) kierują się i wzajemnie spodziewają się kierowania postulatami teorii Zeuthen’a-Nash’a oraz, że nie znają nawzajem swoich funkcji wypłaty. Załóżmy jednak, że obaj gracze formułują jednowartościowe estymaty funkcji wypłaty i innych nieznanych sobie zmiennych charakteryzujących drugiego gracza. Oczywiście, generalnie te estymaty nie muszą być zgodne z rzeczywistymi wartościami tych zmiennych6 . Przy takim podejściu, gracz 1 może spróbować wybrać swój punkt zgody A1 poprzez maksymalizację funkcji π0 = π(u1 , u2 ) zdefiniowanej zależnością (C.3). Jednakże ponieważ gracz 1 nie zna funkcji u2 , to wszystko co może zrobić to maksymalizacja funkcji π1 = π(u1 , e1 u1 ), w której jego mniej lub bardziej niedokładna estymata e1 u2 zastępuje prawdziwą funkcję użyteczności u2 gracza 2. Stąd faktycznie A1 będzie punktem, dla którego maksymalną wartość przyjmuje funkcja π(u1 , e1 u2 ). Tę wartość A1 możemy traktować jako estymatę gracza 1 rzeczywistego rozwiązania Zeuthen’a-Nash’a A∗ , co zapisać można zależnością: A1 = e1 A∗ . 6 (C.6) Ten sam wniosek uzyskamy wówczas, gdy uczynimy bardziej ogólne założenie, że gracze nie formułują jednowartościowej estymaty, ale że każdy z nich wyznacza subiektywny rozkład wspólnych prawdopodobieństw odnośnie zmiennych sobie nieznanych i wówczas próbuje maksymalizować wartość oczekiwaną użyteczności w oparciu o ten rozkład prawdopodobieństwa. C.3. ESTYMACJA ARBITRAŻOWEGO ROZWIĄZANIA ZEUTHEN’A-NASH’A W PRZYPADKU NIEZNAJOMOŚCI FUNKCJI UŻYTECZNOŚCI 93 Podobnie punkt zgody A2 gracza 2 będzie punktem gdzie maksymalizowana jest funkcja π2 = π(e2 u1 , u2 ), co interpretować można jako estymatę gracza 2 rzeczywistego rozwiązania Zeuthen’a-Nash’a A∗ : A2 = e2 A∗ . (C.7) Jednakże bardziej wyrafinowani gracze mogą rozegrać lepiej, niż to wyżej zostało zarysowane. Gracz 1 wie, że gracz 2 faktycznie wybiera swój punkt zgody w oparciu o maksymalizację funkcji (iloczynu) π2 nie zaś w oparciu o maksymalizację teoretycznie poprawnej funkcji π0 . Dlatego też gracz 1 będzie starał się oszacować funkcje e2 u1 oraz u2 , użyte przez gracza 2 w funkcji π2 , a następnie maksymalizował będzie iloczyn π21 = π(e1 e2 u1 , e1 u2 ), która wykorzystuje estymaty e1 e2 u1 i e1 u2 tych dwu funkcji. Punkt A1 (2), w którym maksymalizuje się iloczyn π21 reprezentuje teraz obliczoną przez gracza 1 estymatę punktu zgody A2 = e2 A∗ gracza 2. Jednocześnie punkt ten będzie nowym, poprawionym punktem zgody gracza 1, ponieważ punkt ten wyznacza maksymalny zakres ustępstw jaki musi poczynić gracz 1, aby nie doprowadzić do zerwania negocjacji. Stąd nowy (poprawiony) punkt zgody gracza 1, który nazwać możemy punktem zgody drugiego rzędu (second-order ) wyrazi się zależnością: A1 (2) = e1 A2 = e1 e2 A∗ , (C.8) który jest punktem w którym maksymalizuje się iloczyn π21 . W podobny sposób przebiegać będzie rozumowanie gracza 2, jeśli kierował on będzie się tą bardziej wyrafinowaną strategią wyboru poprawionego punktu zgody drugiego rzędu. Punkt ten określić można w sposób następujący: A2 (2) = e2 A1 = e2 e1 A∗ (C.9) i w nim maksymalizuje się iloczyn π12 = π(e2 u1 , e2 e1 u2 ). Oczywiście gracz 1 może teraz kontynuować to wyrafinowane rozumowanie dążąc do określenia punktu zgody trzeciego rzędu A1 (3), jako estymatę punktu zgody drugiego rzędu A2 (2) gracza 2: A1 (3) = e1 e2 A1 = e1 e2 e1 A∗ , (C.10) Punkt ten maksymalizował będzie iloczyn π121 = π(e1 e2 u1 , e1 , e2 , e1 , u2 ). Proces ten kontynuować można w nieskończoność. Generalnie, punkt zgody n-tego rzędu gracza 1 przyjmie postać: A1 (n) = A1 (2k − 1) = (e1 e2 )k−1 e1 A∗ (C.11) A1 (n) = A1 (2k) = (e1 e2 )k A∗ (C.12) dla n nieparzystego, i DODATEK C. JOHN’A C. HARSANYI: DWUSTRONNE NEGOCJACJE W SYTUACJI NIEZNAJOMOŚCI FUNKCJI UŻYTECZNOŚCI KONTRPARTNERA W GRZE. 94 dla n parzystego. Ostatecznie, jedynym, w pełni satysfakcjonującym punktem zgody gracza 1 będzie punkt graniczny Ā1 (granica) tej sekwencji A1 (n) – zakładając, że taka granica istnieje. Ā1 Harsanyi nazywa ostatecznym punktem zgody (final concession point). Ostateczny punkt zgody gracza 2 definiuje się w analogiczny sposób. Oczywiście, przy założeniu takiej definicji ostatecznych punktów zgody Ā1 i Ā2 , jako granicy sekwencji 1 (n) i 2 (n) zapisać można następujące zależności: Ā1 = e1 Ā2 , (C.13) Ā2 = e2 Ā1 . (C.14) Oznacza to, że ostateczny punkt zgody Ā1 gracza 1 musi odpowiadać jego przewidywaniu odnośnie ostatecznego punktu zgody gracza 2 i vice versa. Podobieństwo równań (C.11) i (C.12) do równań (C.1) i (C.2), w przypadku wzajemnie znanych funkcji użyteczności jest oczywiste. Istnieje jednakże istotna różnica, jako że w równaniach (C.11) i (C.12) n-ty element sekwencji A1 (n) nie zależy od (n + 1)-ego elementu A1 (n + 1). Zależy natomiast od oczekiwania wyższego rzędu gracza 1 (tj. jego oczekiwania odnośnie oczekiwania kontrpartnera) odnośnie oczekiwania danego rzędu związanego z funkcjami u1 i u2 . Stąd problem nieskończonej regresji w tym miejscu nie występuje. Jednakże problem złożonych oczekiwań występuje w przedstawionej w następnym punkcie, nieco zmienionej formie. C.4 Problem zbieżności i wzajemnej kompatybilności sekwencji Ai (n) W rzeczywistym świecie, sytuacje negocjacyjne, w ramach których strony posiadają bardzo ograniczone informacje na temat wzajemnych funkcji użyteczności (tj. na temat wzajemnych preferencji i stosunku do ryzyka) są bardzo powszechne. Jednakże zwykle każda ze stron obmyśla swoją strategię gry, jak również określa wartość ostatecznych punktów zgody – Ā1 i Ā2 , które odpowiadają ich przypuszczeniom na temat zachowania się kontrpartnera w grze. To zdaje się pokazywać, że dla obu stron sekwencje A1 (n) i A2 (n) zwykle zbiegają się do pewnych dość dobrze zdefiniowanych punktów Ā1 i Ā2 . Istotnie, dość często obie strony zawierają porozumienie, tj. unikają wzajemnie niekompatybilnych żądań. To oznacza, że gracze ci nie tylko wybierają dobrze zdefiniowane, ale również wzajemnie kompatybilne ostateczne punkty zgody Ā1 i Ā2 . Te przypadki zdają się zachodzić znaczenie częściej, niż wskazywać by na to mógł wybór przypadkowego losu. Rodzi to dwa istotne pytania: C.4. PROBLEM ZBIEŻNOŚCI I WZAJEMNEJ KOMPATYBILNOŚCI SEKWENCJI AI (N ) 95 1. Jaki mechanizm sprawia, że dla każdego z graczy i (i = 1, 2) sekwencja Ai , Ai (2), . . . , Ai (n), . . . zbiega się do dobrze zdefiniowanego punktu granicznego Āi , który staje się następnie punktem zgody danego gracza w grze negocjacyjnej? 2. Jaki mechanizm sprawia, że ostateczne punkty zgody obu graczy Ā1 i Ā2 , reprezentujące granice dwóch sekwencji A1 (n) i A2 (n), są wzajemnie kompatybilne? Zdaniem Harsanyi odpowiedź na pytanie 1 zdaje się być bardzo prosta. Zbieżność sekwencji Ai , Ai (2), . . . , Ai (n), . . . do określonej wartości Āi , może być wynikiem tego, że gracze wykonują jedynie kilka pierwszych kroków tego ciągu rozumowania: jaka jest jego funkcja użyteczności , jaka jest jego estymata mojej funkcji użyteczności, jaka jest jego estymata mojej estymaty jego funkcji użyteczności itd. Formalnie oznacza to, że Ai (n) staje się sekwencją stałą, po przebyciu pierwszych, powiedzmy, k kroków i stąd z konieczności zbiega się do określonej wartości. Ponadto, co stanie się bardziej oczywiste po przeczytaniu niżej przedstawionych argumentów, mechanizm sprawiający, że ostateczne punkty zgody Ā1 i Ā2 są wzajemnie kompatybilne, również pomaga w osiągnięciu zbieżności sekwencji Ai (n) do dobrze zdefiniowanego punktu Āi . Stąd odpowiedź na pytanie 2 po części przyniesie też odpowiedź na pytanie 1. Nawiązując do pytania 2, dwa mechanizmy zdają się prowadzić do tego, że ustalone niezależnie punkty zgody Ā1 i Ā2 są wzajemnie kompatybilne. Pierwszy mechanizm wynika, jak można przypuszczać, z dobrze ugruntowanej tradycji kulturowej różnych społeczności, kształtującej oczekiwania graczy odnośnie własnej i drugiej strony funkcji użyteczności. Innymi słowy, jest prawdopodobne, że wszyscy członkowie danej społeczności (lub precyzyjniej osoby tej tej samej płci, wieku, pozycji społecznej, poziomu wykształcenia itp.) spodziewają się posiadania w istocie takiej samej czy bardzo podobnej funkcji użyteczności. Tę wykreowaną przez społeczność i przypisaną jej członkom funkcję użyteczności u0 Harsanyi określa stereotypową funkcją użyteczności. Przy takim założeniu, w konkretnej grze negocjacyjnej, przykładowo gracz 1 wie, że gracz 2 oczekuje od niego posiadania pewnej stereotypowej funkcji użyteczności u01 , natomiast gracz 2 wie, że gracz 1 oczekuje od gracza 1 takiego oczekiwania, itd. Podobnie gracz 1 będzie oczekiwał od gracza 2 posiadania pewnej stereotypowej (prawdopodobnie innej) funkcji użyteczności u02 . Ten mechanizm – mechanizm zakładania istnienia stereotypowej funkcji użyteczności – nazwiemy mechanizmem I. Z drugiej strony założyć możemy, że kompatybilność punktów zgody Ā1 i Ā2 nie wynika z uprzedniego założenia ich wartości (np. w oparciu o założenie istnienia stereotypowej funkcji użyteczności) jeszcze przed rozpoczęciem negocjacji, ale że wynika z ich wzajemnego dostosowania w trakcie procesu negocjacji. Ten mechanizm określimy jako mechanizm II. Oczywiście powszechne rozumienie procesu negocjacji jest zgodne z mechanizmem II. Pro- DODATEK C. JOHN’A C. HARSANYI: DWUSTRONNE NEGOCJACJE W SYTUACJI NIEZNAJOMOŚCI FUNKCJI UŻYTECZNOŚCI KONTRPARTNERA W GRZE. 96 ces negocjacji nie polega na wzajemnej wymianie „ultimatów” – ostatecznych ofert, ale raczej na długotrwałej wymianie różnych tymczasowych propozycji i kontr-propozycji, nastawionej w dużej mierze na zbadanie sytuacji drugiej strony. Jednakże w naszej analizie nie rozsądnym byłoby pomijanie mechanizmu I, z tego względu, że sam mechanizm II działał będzie poprawnie jedynie wówczas, gdy blefowanie (tj. zniekształcanie informacji na temat rzeczywistej wartości własnego punktu zgody) w negocjacjach poddane jest efektywnej kontroli (co w rzeczywistych warunkach zdaje się nie mieć miejsca). Dla uzasadnienia tego stwierdzenia rozważmy sytuację negocjacyjną, w której blefowanie jest w pełni dozwolone i niezwiązane z żadnymi karami. Przypuśćmy, że gracze 1 i 2 rozpoczynają negocjacje z całkowicie niekompatybilnymi punktami zgody Ā1 i Ā2 . Oznacza to, że gracz 1 planuje nie wycofywać się z punktu Ā1 ponieważ (błędnie) przypuszcza, że gracz 2 to rozwiązanie zaakceptuje. Z drugiej strony gracz 2 planuje nie wycofywać się z punktu Ā2 , ponieważ (równie błędnie) spodziewa się, że gracz 1 to rozwiązanie zaakceptuje. Przy takim założeniu, mimo, że oba punkty zgody są niekompatybilne, gracze nie mają szansy zrewidować (poprawić) swoje punkty zgody w trakcie procesu negocjacji. Oczywiście, każda ze stron zauważy, że w trakcie negocjacji kontrpartner przejawia silniejszy opór niż się tego dany gracz spodziewał. Jednakże traktował to będzie jako zwykły blef i do ostatniej minuty oczekiwał będzie zmiany jego punktu zgody. Dlatego też tak długo dopokąd blefowanie jest dozwolone mechanizm II nie doprowadzi do uzgodnienia rozwiązania, jeśli punkty zgody nie były kompatybilne przed rozpoczęciem negocjacji. Dla kontrastu, mechanizm II byłby w tej sytuacji w pełni efektywny. Jeżeli gracz 2 spodziewał by się od gracza 1 posiadania stereotypowej funkcji użyteczności u01 , gracz 1 miałby silną motywację do tego, by działać tak, jakby u01 była rzeczywistą jego funkcją użyteczności i to nawet wówczas, jeśli jego rzeczywista funkcja u1 była by inna. Wynika to stąd, że jeśli jego rzeczywista funkcja użyteczności nakazywałaby mu być twardszym w negocjacjach (żądać więcej) niż wskazywałaby mu na to stereotypowa funkcja u01 , gracz 1 miałby poważne trudności z przekonaniem gracza 2, że jego twardsza postawa nie jest w istocie zwykłym blefem. Z drugiej strony, jeśli jego rzeczywista funkcja użyteczności gracza 1 sugerowała by mu żądanie mniej niż wskazywałaby na to stereotypowa funkcja użyteczności, to przekazywanie tej informacji graczowi 2 nie byłaby w jego (gracza 1) interesie. Podsumowując, w przypadku, gdy blefowanie w negocjacjach nie jest zabronione, jeśli obaj gracze spodziewają się względem siebie stosowania stereotypowej funkcji użyteczności u0i , mimo, że rzeczywiste ich funkcje użyteczności ui są różne, otrzymamy następujące zależności: e2 u1 = e1 e2 u1 = e2 e1 e2 u1 = . . . = u01 (C.15) e1 u2 = e2 e1 u2 = e1 e2 e1 u2 = . . . = u02 (C.16) C.5. MODEL GRY UŁATWIAJĄCY DOPROWADZENIE DO KOMPLEMENTARNOŚCI PUNKTÓW ZGODY, W PRZYPADKU DOPUSZCZENIA BLEFOWANIA 97 nawet, jeśli ui 6= u0i . Stąd też, obie sekwencje A1 (n) i A2 (n) będą zbiegały się do wspólnego punktu A = Ā, który będzie maksymalizował iloczyn π 0 = π(u01 , u02 ). (Bardziej precyzyjnie rzecz ujmując, podczas gdy pierwszy element tych sekwencji może być różny od Ā, to każdy następny będzie jemu równy). C.5 Model gry ułatwiający doprowadzenie do komplementarności punktów zgody, w przypadku dopuszczenia blefowania Harsanyi podaje następujący sposób wprowadzenia kary za blefowanie, zapożyczony od Roberta J. Aumanna. Proces negocjacji zostaje podzielony na n etapów. Na każdym z etapów k, obaj gracze wiedzą, że negocjacje zostaną przerwane, jeśli ich wzajemne oferty B1 (k) i B2 (k) będą oddalone od siebie na odległość większą niż D(k). Na pierwszym etapie negocjacji tolerowane są nawet bardzo duże różnice pomiędzy ofertami graczy, tzn. D(1) jest duże. Jednakże w późniejszych etapach (przy zwiększaniu k) D(k) stopniowo maleje, aż do zrównania się w ostatnim n-tym kroku z wartością 0 (D(n) =)), co oznacza, że obaj gracze muszą zaakceptować te same warunki, jeśli chcą zawrzeć porozumienie. W ramach tego modelu ciągle pozostaje prawdą, że w dowolnym momencie, punkt zgody – powiedzmy gracza 1 – Ā1 przyjmie wartość równą przewidywanej przez gracza 1 wartości punktu zgody gracza 2, tj. Ā1 = e1 Ā2 (patrz równanie (C.13)). Jednakże na etapie k-tym gracz 1 wie, że może bezpiecznie złożyć ofertę B1 (k) o D(k) dla siebie korzystniejszą niż Ā1 = e1 Ā2 . W tym zakresie będzie mógł więc blefować. Jednakże jego kontrpartner, gracz 2 będzie w pełni świadomy tego i będzie wiedział, że prawdziwy punkt zgody gracza 1 położony jest o odległość D(k) od jego oferty B1 (k). Oznacza to, że na etapie (k + 1), gracz 2 będzie wiedział gdzie leżał punkt zgody Ā1 gracza 1, na poprzednim etapie, tj. etapie k. Podobnie, gracz 1 będzie wiedział, gdzie leżał prawdziwy punkt zgody gracza 2 na poprzednim etapie. Oczywiście, żaden z graczy nie będzie dokładnie widział gdzie na danym etapie gry znajduje się punkt zgody jego kontrpartnera, ponieważ żaden z graczy nie wie, jak jego ostatnia oferta wpłynęła na wartość rzeczywistego punktu zgody kontrpartnera. Jednakże wiedząc w jaki sposób punkt zgody kontrpartnera przesuwał się w trakcie kolejnych etapów negocjacji, obaj będą w stanie w najgorszym razie odgadywać (w oparciu o konkretne informacje), i przypuszczalnie w ostatnim, n-tym etapie (jeśli nie wcześniej), będą wiedzieli dostatecznie dużo na temat tego, jakie ostateczne oferty mogą złożyć bez zbyt dużego ryzyka odrzucenia ich. Tak więc w ramach tego modelu mechanizm II może działać zupełnie poprawnie. Nawet jeśli obie strony rozpoczęły negocjacje ze wzajemnie nieprzystającymi oczekiwaniami, istnieje duża szansa, że na koniec tego n-etapowego procesu negocjacji ich wzajemne oczekiwania będą DODATEK C. JOHN’A C. HARSANYI: DWUSTRONNE NEGOCJACJE W SYTUACJI NIEZNAJOMOŚCI FUNKCJI UŻYTECZNOŚCI KONTRPARTNERA W GRZE. 98 bardziej spójne. Oczywiście dostępność mechanizmu I jest tu pomocna, tzn. jeśli obie strony rozpoczęły negocjacje z niezbyt rozbieżnymi (bo opartymi na stereotypowych funkcjach użyteczności) oczekiwaniami, to istnieje mniejsze niebezpieczeństwo, że już w pierwszym etapie różnica pomiędzy ich ofertami przekroczy dozwolony dystans D(1) i przypuszczalnie ustalenie wspólnie akceptowalnego punktu zgody zajmie mniej etapów. Pełna efektywność mechanizmu II zależy jednakże od aktualnych założeń przyjętych w modelu. W większości realnych sytuacji negocjacyjnych prawdopodobnie istnieje coś w rodzaju tolerowalnej odległości D(k) pomiędzy ofertami składanymi przez graczy i negocjacje zostają zerwane jeśli odległość ta jest zbyt wielka, lub jako taka zbyt długo się utrzymuje. Jednakże precyzyjne określenie wartości D(k) (akceptowalnej przez obu graczy) w realnych negocjacjach jest bardzo trudne i prawdopodobnie wartość ta winna być traktowana jako zmienna losowa. W takich warunkach aktualne oferty graczy pozwalają jedynie na bardzo ogólne wnioskowanie na temat ich prawdziwych punktów zgody i niosą znacznie mniej informacji na temat ich wzajemnej skłonności do ustępstw, niż to było w przypadku rozpatrywanego wyżej modelu. W konsekwencji, istnieje znacznie mniejsza możliwość uzgodnienia wzajemnie spójnych oczekiwań w trakcie trwania procesu negocjacji. Stąd dużo ważniejsze dla możliwości uzyskania porozumienia staje się rozpoczęcie negocjacji, w oparciu o oczekiwania, bazujące na stereotypowych funkcjach użyteczności. C.6 Ograniczona użyteczność przetargu (bargaining ) W świecie gdzie ludzie znali by nawzajem swoje funkcje użyteczności, nie byłoby praktycznie potrzeby przeprowadzania negocjacji7 rozumianych w tradycyjny sposób, ponieważ gracze nie musieli by wzajemnie testować funkcji użyteczności kontrpartnera poprzez kolejne sekwencji ofert i kontrofert. Każdy z graczy mógłby po prostu ogłosić swoje ostateczne warunki w sposób niezależny od drugiego i następnie porównać je z warunkami ogłoszonymi przez drugiego gracza. Jeśli warunki te byłyby wzajemnie komplementarne, każdy z nich otrzymałby to, o co prosi. Jeżeli nie byłyby komplementarne, zgoda nie byłaby zawarta (pod warunkiem, że oferty miały charakter ultimatum). Jednakże w przypadku racjonalnych graczy można by łatwo zapewnić możliwość uzyskania rozwiązania8 , ponieważ każdy z graczy mógłby je w sposób prosty wyliczyć, a następnie przedstawić swoją ofertę w taki sposób, by żądać tylko takie wartości wypłaty dla 7 To stwierdzenie jest prawdziwe tak zarówno w klasycznym przetargu pozycyjnym [13], czy jak to bywa inaczej nazywane, w przypadku negocjacji dystrybucyjnych [95], właściwych dla negocjacji dotyczących jednego zagadnienia [96], jak też dla negocjacji integracyjnych, właściwych dla negocjacji dotyczących wielu kwestii [18]. 8 Harsanyi zakłada tu, że jakiekolwiek rozwiązanie zawarte przy stole negocjacyjnym jest lepsze od braku porozumienia. C.6. OGRANICZONA UŻYTECZNOŚĆ PRZETARGU (BARGAINING) 99 siebie, jaka odpowiadałaby temu rozwiązaniu. Nawet w sytuacji, gdy gracze nie znają nawzajem swoich funkcji użyteczności, jednak gdzie blefowanie nie jest zabronione, negocjacje (przetarg pozycyjny) miałyby mały sens, ponieważ gracze nie mogli by uzyskiwać użytecznych informacji na temat nieznanej funkcji użyteczności kontrpartnera poprzez obserwację sposobu jego negocjowania – przy założeniu, że obaj grają racjonalnie w tym sensie, że nie ujawniają rzeczywistych informacji, mogących osłabić ich pozycję w grze. Oczywiście w takiej sytuacji, negocjacje mogłyby funkcjonować nadal jako forma widowiska, lub odgrywać rolę pewnej ceremonii. Oczywiście byłoby również miejsce dla negocjacji spełniających rolę inną, niż przetargowa (bargaining), jak np. przekazywanie faktycznych informacji odnośnie możliwości kooperacji, czy strategicznych możliwości każdej ze stron dostępnych poza stołem negocjacyjnym. W rzeczywistym świecie istnieje jednakże miejsce dla negocjacji rozumianych w kategoriach przetargu z tego względu, że strony nie znają nawzajem swoich funkcji użyteczności oraz ponieważ posiadają pewne motywacje do unikania blefowania. Tak więc obserwacja ofert kontrpartnera umożliwia zebranie pewnych informacji na temat jego funkcji użyteczności. Oczywiście istnieje też możliwość, że kontrpartner popełni jakiś błąd taktyczny odsłaniając jakiś słaby punkt w negocjacjach. Jeśli założymy, że powyższe rozumowanie jest poprawne, tzn. że zakres użytecznych informacji, które gracze uzyskać mogą w trakcie negocjacji, jest istotnie ograniczony (i jeśli jest prawdą, że doświadczeni negocjatorzy rzadko ujawniają informacje na temat ich słabych punktów), wówczas należy uznać, że przetarg jest praktyką znacznie mniej użyteczną niż się to powszechnie wydaje na pierwszy rzut oka. DODATEK C. JOHN’A C. HARSANYI: DWUSTRONNE NEGOCJACJE W SYTUACJI NIEZNAJOMOŚCI FUNKCJI UŻYTECZNOŚCI KONTRPARTNERA W GRZE. 100 Zakończenie W ramach zakończenia podsumowane zostaną podstawowe rezultaty pracy oraz nakreślone kierunki dalszych badań. Rezultaty pracy są następujące: • Dokonano analizy źródeł niepewności i ryzyka oraz związanych z nimi ograniczeń informacyjnych w konkurencyjnych i poddanych regulacji grach rynkowych. • Zaproponowano sposób modelowego ujęcia ograniczeń informacyjnych w grach rynkowych. • Dokonano analizy podejścia do gier z niepełną informacją zaproponowaną przez J.C. Harsanyi i pokazano jego ograniczenia. • Uzupełniono podejście Harsanyi o elementy analizy ograniczeń informacyjnych typowych dla konkurencyjnych gier rynkowych. Pożądanym kierunkiem dalszych studiów w zakresie informacyjnych aspektów konkurencyjnych gier rynkowych są zagadnienia związane z jednoczesnym występowaniem elementu konkurencji i kooperacji, co jest elementem charakterystycznym dla rynku telekomunikacyjnego. 101 102 DODATEK C. ZAKOŃCZENIE Bibliografia [1] Neil Abragimowicz. Modele symulacyjne i optymalizacyjne wspomagające ustalanie taryf telekomunikacyjnych w połączeniach międzyoperatorskich. Praca dyplomowa, Politechnika Warszawska Wydział Elektroniki i Technik Inforamacyjnych Instytut Automatyki i Informatyki Stosowanej, Warszawa, 1999. [2] T. Basar, R. Srikant. lowers. A stackelberg network game with a large number of fol- Journal of Optimization Theory and Applications, 115(3):479–490, 2002. http://decision.csl.uiuc.edu/ tbasar/jota02-homepage.pdf. [3] David Begg, Stanley Fischer, Rudiger Dornbusch. Mikroekonomia. Polskie Wydawnictwo Ekonomiczne, Warszawa, 1999. [4] Vera F. Birkenbihl. Komunikacja Werbalna – psychologia prowadzenia negocjacji. Wydawnictwo Astrum, Wrocław, 1997. [5] Anna Blajer-Gołębiewska, Małgorzata Zielenkiewicz. Teoria gier jako narzędzie ekonomii xx i xxi wieku. http://mikro.univ.szczecin.pl/bp/pdf/17/7.pdf. [6] Christian Bongard, Dirk Moller, Achim Raimann, Nikodem Szadkowski, Urszula Dubejko. Instrumenty ekonomiczne w prawie konkurencji. Urząd Ochrony Konkurencji i Kosnumentów, Bonn/Warszawa, 2007. [7] Michael Carter, Julian Wright. Bargaining over interconnection: the clear-telecom dispute. Working Paper 13, Centre for Research in Network Economics and Communications, University of Auckland, 2000. [8] Robert Cialdini. Wywieranie wpływu na ludzi – teoria i praktyka. Gdańskie Wydawnictwo Psychologiczne, Warszawa, 2004. [9] Commission recommendation on relevant product and service markets within the electronic communications sector susceptible to ex ante regulation in accordance with Directive 2002/21/EC of the European Parliament and of the Council on a common regulatory framework for electronic communication networks and services. Official Journal of the European Union, 2003. 103 104 BIBLIOGRAFIA [10] David Cray, Gregory E. Kersten. Negotiating inefficient compromises: Is less better than more. Interim Report IR-99-022, IIASA, Laxenburg, Austria, 1999. [11] Mira Montana Czarnowska. Podstawy negocjacji i komunikacji. Wyższa Szkoła Humanistyczna, Pułtusk, 2003. [12] Roger Dawson. Sekrety udanych negocjacji. Wydawnictwo Santorski Wamex, Warszawa, 1997. [13] Roger Dawson. Sekrety udanych negocjacji. Wydawnictwo Santorski Co, Warszawa, 2000. [14] Decision theory and games. www.actuarial.unsw.edu.au/courses/actl3003/ documents/LectureNotes/lecturenote10.pdf. [15] Scott Denegre, Ted Raplhs. Multiobjective mixed-integer stackelberg games. Euro XXI, Reykjavic, Iceland, 2006. [16] Nicholas Economides, Giuseppe Lopomo, Glenn Woroch. Strategic commitments and the principle of reciprocity in interconnection pricing. Discussion Paper EC-96-13, Stern School of Business, New York University, 1996. [17] R. Faure, J.P. Boss, A. Le Garf. Badania operacyjne. Państwowe Wydawnictwo Naukowe, Warszawa, 1982. [18] Roger Fisher, William Ury, Bruce Patton. Dochodząc do TAK - Negocjowanie bez poddawania się. Polskie Wydawnictwo Ekonomiczne, Warszawa, 2000. [19] Krzysztof Fleszar. Zastosowanie analizy wielokryterialnej do wspomagania decyzji strategicznych. Praca magistarska, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki i Informatyki Stosowanej, Warszawa, 2001. [20] Kenji tic Fujiwara. competition A with stackelberg sticky price. game model Economics of dynamic Bulletin, duopolis12(12):1–9. http://economicsbulletin.vanderbilt.edu/2006/volume12/EB-06L10030A.pdf. [21] Wojciech Gawęda. Spory w relacjach międzyoperatorskich – zasady ich rozstrzygania i ingerencja regulatora. Liberalizacja dostępu telekomunikacyjnego, 3-4 października 2006. Le Royal Meridien Bristol, Warszawa. [22] Daniel Goleman. Inteligencja emocjonalna w praktyce. Media Rodzina, Poznań, 1999. [23] Janusz Granat. Metody interakcji z użytkownikiem w wielokryterialnych systemach wspomagania decyzji. Rozprawa doktorska, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki i Informatyki Stosowanej, Warszawa, 1997. [24] Janusz Granat, Marek Makowski. Interactive specification and analysis of aspiration-based preferences. European Journal of Operational Research, (122):469–485, 2000. 105 BIBLIOGRAFIA [25] Janusz Granat, Andrzej P.Wierzbicki. Interactive specification of dss user preferences in terms of fuzzy sets. Raport instytutowy WP-94-29, IIASA, Laxenburg, Austria, 1994. [26] Janusz Granat, Andrzej P. Wierzbicki. Komputerowe narzędzia do wspomagania decyzji w sektorze telekomunikacyjnym. Telekomunikacja i Techniki Informacyjne, 3-4, 2000. [27] Janusz Granat, Andrzej P. Wierzbicki. Wybrane zastosowania technik wspomagania decyzji w sektorze telekomunikacyjnym. Krajowe Sympozjum Telekomunikacyjne, Bydgoszcz, 2000. [28] John C. Harsanyi. Bargaining in ignorance of the opponent’s utility function. Journal of Conflict Resolution, 6(1):29–38, 1962. http://cowles.econ.yale.edu/P/cp/p01b/ p0173.pdf. [29] John C. Harsanyi. Games with incomplete information – nobel lecture. strony 136–152, 1994. http://nobelprize.org/nobel_prizes/economics/laureates/1994/ harsanyi-lecture.pdf. [30] Benjamin E. Hermalin, Michael L. Katz. Network interconnection with two-sided user benefits. Working paper, University of California, 2001. [31] Tim Hindle. Skuteczne Negocjacje. Wydawnictwo Wiedza i Życie, Warszawa, 2000. [32] Ganesh tribution Iyer, J. Miguel channels. Villas-Boas. Journal of A bargaining Marketing theory Research, of dis- XL:80–100. http://groups.haas.berkeley.edu/marketing/PAPERS/IYER/bargaining.pdf. [33] Alicja Jarugowa, Irena Sobańska, Renata Sochacka. Metody kalkulacji - koszty, ceny, decyzje. Państwowe Wydawnictwo Ekonomiczne, Warszawa, 1991. [34] Jacek Kamiński. Negocjacje jako proces etyczny. Biuletyn informacyjny Zespołu Etyki Biznesu 65, Towarzystwo Naukowe Prakseologii, Warszawa, 2002. www.cebi.win.pl/ texty/listopad02.doc. [35] Jacek Kamiński. Negocjowanie – techniki rozwiązywania konfliktów. poltext, Warszawa, 2004. [36] Gregory E. Kersten, Geoff R. Mallory. Rational inefficient compromises in negotiation. Interim Report IR-98-024, IIASA, Laxenburg, Austria, 1998. [37] Tomasz Kręglewski, Janusz Granat, Andrzej P. Wierzbicki. IAC-DIDAS-N, A Dynamic Interactive Decision Analysis and Support System for Multicriteria Analysis of Nonlinear Models, wolumen 4.0. IIASA, Laxenburg, Austria, 1991. [38] Adam Krzemienowski. Średnia warunkowa jako narzędzie wspomagania decyzji w warunkach ryzyka. Rozprawa doktorska, Politechnika Warszawska, Wydział Elektroniki i Technik, Warszawa, 2006. 106 BIBLIOGRAFIA [39] ks. Marek Dziewiecki. Psychologia porozumiewania się. Jedność, Kielce, 2004. [40] Michał Kuziak. Jak mówić, rozmawiać, przemawiać? Wydawnictwo Park, Bielsko-Biała, 2005. [41] Sylwester Laskowski. Criteria of choosing strategy in games against nature. EUROCON 2007 - The International Conference on Computer as a Tool, strony 2323–2328, Warsaw. IEEE press. [42] Sylwester Laskowski. Opracowanie narzędzi analitycznych do wspomagania decyzji dotyczących wysokości opłat taryfikacyjnych i stawek rozliczeniowych na konkurencyjnym rynku telekomunikacyjnym. Praca statutowa, Instytut Łączności, 20. [43] Sylwester Laskowski. Game against nature: playing on competitive telecommunications services market without knowledge of competitors’ costs. The Fourth International Conference on Decision Support for Telecommunications and Information Society, Warsaw, 2004. National Institute of Telecommunications. [44] Sylwester Laskowski. Modelowanie gry rynkowej na konkurencyjnym rynku telekomunikacyjnym. Telekomunikacja i techniki Informacyjne, 3(4), 2004. [45] Sylwester Laskowski. Niewystarczalność podejścia kosztowego w procesie ustalania cen za usługi telekomunikacyjne. Ósma konferencja na temat: Międzynarodowe i polskie doświadczenia w zakresie połączeń międzyoperatorskich, Warszawa, 2004. Instytut Łączności. [46] Sylwester Laskowski. O roli informacji na temat macierzy wypłat w konkurencyjnej grze na rynku telekomunikacyjnym. Telekomunikacja i techniki Informacyjne, 3(4), 2004. [47] Sylwester Laskowski. Wspomaganie procesu ustalania cen detalicznych i negocjacji stawek rozliczeniowych na konkurencyjnym rynku usług telekomunikacyjnych. Rozprawa doktorska, Politechnika Warszawska, Wydział Elektroniki i Technik, Warszawa, 2004. [48] Sylwester Laskowski. Criteria of choosing strategy in games against nature. The Fifth International Conference on Decision Support for Telecommunications and Information Society, Warsaw, 2005. National Institute of Telecommunications. [49] Sylwester Laskowski. O kolejności ruchów w dwuosobowej grze na konkurencyjnym rynku telekomunikacyjnym z asymetrią informacyjną. Telekomunikacja i techniki Informacyjne, 3(4), 2005. [50] Sylwester Laskowski. Wspomaganie procesu ustalania cen detalicznych na konkurencyjnym rynku telekomunikacyjnym z asymetrią informacyjną. Telekomunikacja i techniki Informacyjne, 1(2), 2005. BIBLIOGRAFIA 107 [51] Sylwester Laskowski. Dobrze doinformowany konkurent. Zeszyty Naukowe Uniwersytetu Szczecińskiego nr 463, Ekonomiczne Problemy Łączności nr 10, Przeobrażenia na rynku łączności i kierunki jego rozwoju, 2007. [52] Sylwester Laskowski. O metodzie wyboru strategii w konkurencyjnej grze podwójnej ze znanym celem konkurenta – przypadki ahb i abh. Telekomunikacja i techniki Informacyjne, (1-2), 2007. [53] Sylwester Laskowski. Ustalona a preferowana kolejność ruchów w grze pojedynczej. Telekomunikacja i techniki Informacyjne, (3-4), 2007. [54] Ming Li, Jr. Jose B. Crus, Marwan A. Simaan. An approach to discrete-time incentive feedback stackelberg games. IEEE Transactions on Systems, Man, and Cyberneticts - Part A: Systems and Humanas, 32(4), 2002. http://www.ece.osu.edu/ cruz/Papers/J99-SMC32-4.pdf. [55] Grzegorz Lissowski. Teoria wyboru społecznego. Skrypt wykładu. [56] Xavier Mancero, Eduardo Saavedra. Entry, cream skimming, and competition: Theory and simulation for santiago de chile’s local telephony market. Raport instytutowy, Instituto Latinoamericano de Doctrina y Estudios Sociales, 2001. www.ilades.cl/economia/ publicaciones/ser_inv/inv132.pdf. [57] Emmanuel Trelat Marc Jungers, Hisham Abou-Kandil. Stackelberg strategy with closedloop information structure for linear quadratic games. HAL - Hyper Articles en Ligne. http://hal.archives-ouvertes.fr/docs/00/08/67/80/PDF/JTAKsiam.pdf. [58] Paweł Markowski, Tomasz Olczyk. Negocjacje czyli rozmowa. Raport instytutowy, Fundacja Rozwoju Demokracji Lokalnej, 2003. www.frdl.org.pl/downloads/negoc4_vadem/ vade4_0301234.pdf. [59] Jacek W. Mercik. Siła i oczekiwania, decyzje grupowe. PWN, Wrocław, 1999. [60] Izabela Mileńko. Zagadnienia wspomagania indywidualnego planowania generacji wytwórców na rynku energii elektrycznej. Praca magisterska, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki i Informatyki Stosowanej, Warszawa, 2000. [61] John Morgan, Felix Vardy. An experimental study of commitment and observability in stackelberg games. Games and Economic Behavior, 49(2):401–423. [62] Roger B. Myerson. Harsanyi’s games with incomplete information. Management Science, (50):1818–1824. [63] Roger B. Myerson. Leartning game theory from john harsanyi. Raport instytutowy. 108 BIBLIOGRAFIA [64] John F. Nash. The work of john nash in game theory. Raport instytutowy. [65] Edward Nowak. Teoria kosztów w zarządzaniu przedsiębiorstwem. Wydawnictwo Naukowe PWN, Warszawa, 1996. [66] Włodzimierz Ogryczak. Wspomaganie decyzji w warunkach ryzyka. Skrypt wykładu, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki i Informatyki Stosowanej, Warszawa, 2002. [67] Magdalena Olender-Skorek, Kornel Brunon Wydro. Wartość informacji. Telekomunikacja i Techniki Informacyjne, 1-2:72–84, 2007. [68] The International Society on Dynamical Games, redaktor. Inverse Stackelberg Games and Their Application to Bilevel Optimal Toll Design Problem, 3-6th July 2006. http: //www-sop.inria.fr/coprin/Congress/ISDG06/Abstract/stankova1.pdf. [69] The International Society on Dynamical Games, redaktor. Inverse Stackelberg Games versus Adverse-Selection Principal-Agent Model Theory, 3-6th July 2006. http://www-sop. inria.fr/coprin/Congress/ISDG06/Abstract/stankova2.pdf. [70] Stanisław Piątek. Prawo telekomunikacyjne Wspólnoty Europejskiej. Wydawnictwo C.H.Beck, Warszawa, 2003. [71] Howard Raiffa. The art and since of negotiation. Harvard University Press, Cambridge Massachusetts, 1982. [72] B. Ricardo Raineri. Network competition: a general equilibrium analysis. Raport instytutowy, Encuentro de la Sociedad de Economia de Chile, 2003. www.econmeetings.cl/ pdf/sesion111raineri.pdf. [73] Alvin E. Roth. Individual rationality and nash’s solution to the bargaining problem. Mathematics of Operatons Research, 2(1), 1977. http://kuznets.fas.harvard.edu/~aroth/ papers/1977_MOR_IndividualRationality.pdf. [74] Bernard Roy. Wielokryterialne wspomaganie decyzji. Wydawnictwo Naukowo-Techniczne, Warszawa, 1990. [75] Robert A. Rządca. Negocjacje w interesach. Polskie Wydawnictwo Ekonomiczne, Warszawa, 2003. [76] Robert A. Rządca, Paweł Wujec. Negocjacje. Polskie Wydawnictwo Ekonomiczne, Warszawa, 1998. [77] Jeswald W. Salacuse. Write first, talk later? using drafts to make deals. Negotiation, (2). A Newsletter Published by the Program on Negotiation at Harvard Law School. 109 BIBLIOGRAFIA [78] Claude Elwood Shannon. A mathematical theory of communication. The Bell System Technical Journal, 27:379–423, 623–656, July, October. Reprint. [79] Marek Siudak. Badania Operacyjne. Oficyna Wydawnicza Politechniki Warszawskiej, Warszawa, 1998. [80] Vasiliki Skreta. Interconnection negotiations between telecommunication networks and universal service objectives. Raport instytutowy, University of Minnesota, 2002. www. econ.umn.edu/~screta/data/net.pdf. [81] Andrzej Stachurski, Andrzej P. Wierzbicki. Podstawy optymalizacji. Oficyna Wydawnicza Politechniki Warszawskiej, Warszawa, 1999. [82] David Stiebel. Kiedy rozmowa pogarsza sprawę. Wydawnictwo Amber, 1997. [83] Philip D. Straffin. Teoria gier. Wydawnictwo Naukowe Scholar, Warszawa, 2001. [84] Lawrence E. Susskind, Robert H. Mnoookin, Boyd Fuller, Lukasz Rozdeiczer. Teaching multiparty negotiation. Program on negotiation at Harvard Law School, 2003. Conference Summary. [85] Eugeniusz Toczyłowski. Optymalizacja w badaniach operacyjnych. Skrypt wykładu, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki i Informatyki Stosowanej, Warszawa, 1996. [86] Eugeniusz Toczyłowski. Optymalizacja procesów rynkowych przy ograniczeniach. Akademicka Oficyna Wydawnicza EXIT, Warszawa, 2002. [87] Wiesław Traczyk, i in. Problemy Sztucznej Inteligencji. Wiedza i Życie, Warszawa, 1995. [88] Jerzy Trzaskowski. Negocjacje międzyoperatorskie - standardy współpracy skazanej na kompromis oparty na obustronnych korzyściach. Liberalizacja dostępu telekomunika- cyjnego, 3-4 października 2006. Le Royal Meridien Bristol, Warszawa. [89] Jan Turyna, Beata Pułaska-Turyna. Rachunek kosztów i wyników. Finans Servis, Warszawa, 1996. [90] Tadeusz Tyszka. Konflikty i strategie – niektóre zastosowania teorii gier. Wydawnictwo Naukowo-Techniczne, Warszawa, 1978. [91] Leibniz Universitat, redaktor. Stackelberg games – properties and applications, 24th April. [92] William Ury. Odchodząc od NIE - negocjowanie od konfrontacji do kooperacji. Polskie Wydawnictwo Ekonomiczne, Warszawa, 2000. [93] William Ury. Dochodząc do zgody. Biblioteka Moderatora, Taszów, 2006. [94] Stan van Hoesel. An overview of stackelberg pricing in networks. Research Memoranda 042, Maastricht : METEOR, 2006. http://arno.unimaas.nl/show.cgi?fid=3724. 110 BIBLIOGRAFIA [95] Michael Watkins. Sztuka negocjacji w biznesie - innowacyjne podejścia prowadzące do przełomu. Helion, Gliwice, 2005. [96] Andrzej P. Wierzbicki. Sztuka i techniki negocjacji. Skrypt wykładu, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki i Informatyki Stosowanej, Warszawa, 1996. [97] Andrzej P. Wierzbicki. Reference point methods in vector optimization and decision support. Interim Report IR-98-017, International Institute for Applied Systems Analysis, Laxenburg, Austria, 1998. [98] Andrzej P. Wierzbicki. Optymalizacja i wspomaganie decyzji. Skrypt wykładu, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki i Informatyki Stosowanej, Warszawa, 2000. [99] Andrzej P. Wierzbicki, Janusz Granat. Multi-objective modeling for engineering applications: Didasn++ system. European Journal of Operational Research, (113):374–389, 1999. [100] Andrzej P. Wierzbicki, Marek Makowski. Multi-objective optimization in negotiation support. Raport instytutowy, International Institute for Applied Systems Analysis, Laxenburg, Austria, 1992. [101] Andrzej P. Wierzbicki, Kornel B. Wydro. Informacyjne Aspekty Negocjacji. Wydawnictwo Naukowe Obserwacje, Warszawa, 2006. [102] Nikołaj. N. Worobiew, Edward Kofler, Henryk Greniewski. Strategia gier. Książka i Wiedza, Warszawa, 1969. [103] Glenn A. Woroch. Local network competition. Handbook of Telecommunications Economics, rozdzia/l 15. Cave and Majumdar and Vogelsang, 2002. http://emlab.berkeley. edu./users/woroch/. [104] www.wikipedia.org. Strategia konkurencji. http://pl.wikipedia.org/wiki/ Strategia_konkurencji. [105] Anna Zarębska. Poradnik dla eksporterów, rozdzia/l Techniki prowadzenia negocjacji w kontekście handlu międzynarodowego. Lubelska Fundacja Rozwoju - Euro Info Centre PL416. www.ifr.lublin.pl/poradnik_dla_eksporterow.pdf.