Opracowanie narzędzi analitycznych do
Transkrypt
Opracowanie narzędzi analitycznych do
Instytut Łączności Praca statutowa nr 11.30.004.6 Opracowanie narzędzi analitycznych do wspomagania decyzji dotyczących wysokości opłat taryfikacyjnych i stawek rozliczeniowych na konkurencyjnym rynku telekomunikacyjnym Kontynuacja dr inż. Sylwester Laskowski Konsultacje: prof. dr hab. inż. Andrzej P. Wierzbicki Warszawa, grudzień 2006. ii Spis treści Wprowadzenie ix 1 Analiza zależności pomiędzy ustaloną, a preferowaną kolejnością ruchów w grze pojedynczej 1 2 Ustalona kolejność ruchów – gracz A zna sposób rozegrania gry pojedynczej przez gracza B 2.1 2.2 7 Pierwszym ruchem w grze podwójnej jest proces negocjacji stawek rozliczeniowych na rynku hurtowym – H . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.1.1 W grze pojedynczej pierwszy rusza się gracz A (przypadek HAB) . . . . 9 2.1.2 W grze pojedynczej pierwszy rusza się gracz B (przypadek HBA) . . . . 15 Pierwszym ruchem w grze podwójnej jest proces ustalania cen na rynku detalicznym gracza A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.2.1 Metoda wyboru strategii . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.2.2 Przykład zastosowania metody . . . . . . . . . . . . . . . . . . . . . . . . 30 3 Ustalona kolejność ruchów – gracz A nie zna sposóbu rozegrania gry pojedynczej przez gracza B 3.1 3.2 41 Pierwszym ruchem w grze podwójnej jest proces negocjacji stawek rozliczeniowych na rynku hurtowym – H . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.1.1 W grze pojedynczej pierwszy rusza się gracz A: przypadek HAB . . . . . 42 3.1.2 W grze pojedynczej pierwszy rusza się gracz B: przypadek HBA . . . . . 54 Pierwszym ruchem w grze podwójnej jest proces ustalania cen na rynku detalicznym gracza A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 4 Możliwość kształtowania kolejności ruchów w grze podwójnej 93 Zakończenie 97 iii Bibliografia 100 iv Spis tabel 1 Ilustracja pojęć strategia i wypłata. . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 Macierz wypłat graczy A i B w grze podwójnej, w której opłaca się graczowi A ukształtować grę pojedynczą, jako grę z preferencją drugiego. . . . . . . . . . . . 1.2 . . . . . . . . . . . . . . . . . . 2.1 Macierz wypłat graczy A i B w grze podwójnej. 2.2 Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w trakcie negocjacji wybrana zostanie strategia h1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 10 10 Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w trakcie negocjacji wybrana zostanie strategia h2 . 2.4 6 Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w grze podwójnej została wybrana strategia h2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 5 Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w grze podwójnej została wybrana strategia h1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.9 4 Macierz wypłat graczy A i B w grze podwójnej, w której opłaca się graczowi A ukształtować grę pojedynczą, jako grę z preferencją pierwszego. 1.8 4 Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w grze podwójnej została wybrana strategia h2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.7 4 Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w grze podwójnej została wybrana strategia h1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 3 Macierz wypłat graczy A i B w grze podwójnej, w której opłaca się graczowi A ukształtować grę pojedynczą, jako grę z preferencją pierwszego. 1.5 3 Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w grze podwójnej została wybrana strategia h2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 2 Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w grze podwójnej została wybrana strategia h1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 x . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Macierz wypłat graczy A i B, której struktura umożliwia graczowi B stosowanie gróźb w trakcie negocjacji w grze podwójnej. . . . . . . . . . . . . . . . . . . . . v 12 2.5 Zmodyfikowana macierz wypłat w grze h2 . 2.6 Macierz wypłat graczy A i B, której struktura umożliwia graczowi B stosowanie . . . . . . . . . . . . . . . . . . . . . 13 gróźb w trakcie negocjacji w grze podwójnej. . . . . . . . . . . . . . . . . . . . . 14 2.7 Zmodyfikowana macierz wypłat w grze h2 . 14 2.8 Macierz wypłat w grze, w której gracz A powinien złożyć obietnicę, iż w przypa- . . . . . . . . . . . . . . . . . . . . . dku wybrania strategii h2 , wybierze strategię a2 . . . . . . . . . . . . . . . . . . . 15 Macierz wypłat w grze z ustaloną kolejnością HBA. . . . . . . . . . . . . . . . . 16 2.10 Macierz wypłat w grze pojedynczej. . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.9 2.11 Przykład gry, w której decyzja gracza A prowokuje gracza B do zmiany celu z indywidualnie efektywnego na antagonistyczny. . . . . . . . . . . . . . . . . . . . 23 2.12 Ilustracja gry podwójnej, w której pierwszym ruchem jest ustalenie przez gracza A cen na rynku detalicznym, jako modelu gry przeciwko naturze, której strategiami są możliwe do przyjęcia przez obu graczy wyniki procesu negocjacji hl . . . . . . 29 2.13 Gra podwójna na rynku lokalnym. . . . . . . . . . . . . . . . . . . . . . . . . . . 31 2.14 Macierz wypłat z gry pojedynczej a1 . . . . . . . . . . . . . . . . . . . . . . . . . 32 2.15 Macierz wypłat z gry pojedynczej a2 . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.16 Macierz wypłat z gry pojedynczej a3 . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.1 Macierz wypłat w grze z ustaloną kolejnością HAB, w której gracz A nie zna sposobu rozegrania gry przez gracza B. . . . . . . . . . . . . . . . . . . . . . . . 44 3.2 Odwaga gry w sposób antagonistyczny przez gracza B. . . . . . . . . . . . . . . 57 3.3 Trudność z odczytaniem motywacji gracza B: mądrość, czy antagonizm?. . . . . 57 3.4 Obawa gry w sposób antagonistyczny przez gracza B. . . . . . . . . . . . . . . . 58 3.5 Niepożądane z puntku widzenia gracza A dążenie gracza B do celu indywidualnie efektywnego. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6 59 Przykład gry, w której korzystnym dla obu graczy jest poinformowanie gracza B na temat antagonistycznego celu, do jakiego dąży gracz A. . . . . . . . . . . . . 60 3.7 Korzystna niewiarygodność. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 3.8 Zbieżność antagonizmów. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 3.9 Przykład gry, w której maksymalnie antagonistyczny cel gracza A jest dla gracza B korzystny. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 3.10 Przykład gry, w której minimalnie antagonistyczny cel gracza A stanowić może najbardziej skuteczne narzędzie utrudnienia graczowi B realizacji jego celu. . . . vi 67 3.11 Przykład gry, w której minimalnie antagonistyczny cel gracza A stanowić może najbardziej skuteczne narzędzie utrudnienia graczowi B realizacji jego celu. Cel maksymalnie i minimalnie antagonistyczny gracza A nie wskazują na tę samą strategię ai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 3.12 Przykład gry, w której gracza B korzystna na fakcie, iż gracz A wysunął wobec niego groźbę. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 3.13 Macierz wypłat w grze podwójnej. . . . . . . . . . . . . . . . . . . . . . . . . . . 71 3.14 Macierz skalarnych wartości poszczególnych wyników gry, odzwieciedlających indywidualnie efektywny cel gracza A. . . . . . . . . . . . . . . . . . . . . . . . . . 72 3.15 Macierz wypłat w grze przeciwko naturze, uzyskana z macierzy skalarnych wartości poszczególnych wyników gry. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 3.16 Macierz wypłat w grze podwójnej. . . . . . . . . . . . . . . . . . . . . . . . . . . 74 3.17 Macierz wypłat w grze podwójnej. . . . . . . . . . . . . . . . . . . . . . . . . . . 78 3.18 Macierz wypłat w grze podwójnej. . . . . . . . . . . . . . . . . . . . . . . . . . . 83 4.1 Macierz wypłat w grze pierwotnej. . . . . . . . . . . . . . . . . . . . . . . . . . . 95 4.2 Macierz wypłat w grze przekształconej. . . . . . . . . . . . . . . . . . . . . . . . 95 vii viii Wprowadzenie Niniejsze opracowanie stanowi kontynuację studiów Autora nad tematyką strategicznych gier rynkowych, w celu wypracowania narzędzi analitycznych, użytecznych dla graczy rynkowych w procesie ustalania cen na rynku detalicznym jak też wspomagających w procesie negocjowania stawek rozliczeniowych na rynku hurtowym. Opracowanie jest bezpośrednią kontynuacją prac o tym samym tytule realizowanych w latach 2004 - 2005. W rozumieniu teorii gier [17, 21, 22] sytuację konkurencji na rynku usług telekomunikacyjnych traktować należy jako wielokryterialną, wieloosobową grę o sumie niezerowej [4], w której poszczególni gracze, przedsiębiorstwa telekomunikacyjne dążą do realizacji określonej polityki. Miarę stopnia realizacji tej polityki stanowią określone kryteria oceny (funkcje wypłaty) takie jak zysk, udział w rynku, jakość świadczonych usług, wielkość ponoszonych kosztów czy wielkość generowanego ruchu. Szczególnym przypadkiem jest sytuacja, w której dane przedsiębiorstwo w sposób istotny rozpatruje tylko jedno z kryteriów oceny. W rozumieniu teorii gier sytuację tę określimy jako grę jednokryterialną. Wartość funkcji wypłaty w jednokryterialnej grze rynkowej zależy bezpośrednio od decyzji podjętej przed dane przedsiębiorstwo (danego gracza). W wielu przypadkach wartość ta uzależniona jest również od decyzji konkurentów. Decyzje graczy dotyczące sposobu rozegrania gry rynkowej nazywamy strategiami gry. Tabela 1 ilustruje wzajemną zależność między pojęciami strategii i wypłaty dla dwóch graczy - gracza A i gracza B. Jest to tzw. macierz wypłat. W macierzy tej zilustrowano wypłaty zarówno gracza A, jak i gracza B. Gracz A ma tu do wyboru cztery strategie a1 , a2 , a3 i a4 . Gracz B natomiast strategie b1 , b2 , b3 i b4 . Jeśli gracz A wybierze strategię ai , a gracz B strategię bj , to otrzymają oni w ten sposób A i V B. wypłaty - odpowiednio Vi,j i,j Przyjmujemy, iż funkcja wypłaty bazuje na modelu popytu świadczonych usług i/lub modelu ponoszonych z tego tytułu kosztów. Przykładem tego rodzaju gry rynkowej jest gra o maksymalizację zysku, o maksymalizację udziału w rynku, czy minimalizację ponoszonych kosztów. Zgodnie z dotychczasową konwencją dla określenia strategii gry wprowadzimy następującą definicję: Definicja 0.0.1 Jednostką usługową - SUAnpm nazywamy elementarną część m usługi bądź ix Tabela 1: Ilustracja pojęć strategia i wypłata. b1 b2 b3 .. . b4 ...... ...... A , VB ] [V2,3 2,3 .. . .. . ...... a1 a2 a3 a4 usług, świadczonych przez przedsiębiorstwo A, w n-tej strefie numeracyjnej, dla użytkownika o profilu p, z którą związana jest pobierana od użytkownika opłata PAnpm . Korzystając z powyższej definicji jednostki usługowej SUAnpm oraz odpowiadającej jej ceny PAnpm zdefiniujemy pojęcie strategii: i Definicja 0.0.2 Strategią ai przedsiębiorstwa A nazywamy zbiór par {(SUAnpm , PAnpm )}. W niniejszym opracowaniu skupiono uwagę na tzw. grze podwójnej. W grze tej udział bierze dwóch rzeczywistych graczy (przedsiębiorstwa telekomunikacyjne): gracz A, którego strategiami są jego (A) ceny na rynku detalicznym (ai ) oraz gracz B, którego strategiami są jego (B) ceny na rynku detalicznym (bj ). W grze tej udział bierze również hipotetyczny gracz H, którego strategie reprezentują możliwe wyniki procesu negocjacji stawek rozliczeniowych na rynku hurtowym (hl ). Ruchy poszczególnych graczy reprezentowane są przez procesy ustalania cen na odpowiednich rynkach: • A – proces ustalania cen na rynku detalicznym gracza A, • B – proces ustalania cen na rynku detalicznym gracza B, • H – proces negocjacji stawek rozliczeniowych pomiędzy graczami A i B (ruch hipotetycznego gracza H). Gra podwójna to – zgodnie z wcześniej wprowadzoną definicją [9, 11] – sytuacja growa, w której żaden z procesów ustalania cen nie został zakończony. Procesy te są rozłączne1 . Analiza gier podwójnych stanowi w istocie łącznik pomiędzy grami dwuosobowymi (w szczególności grą przeciwko naturze i 2-osobową grą pojedynczą o sumie niezerowej) a grami wieloosobowymi, stanowiąc swoisty fundament i zalążek właściwej analizy tych ostatnich. Jest tak w szczególności w przypadkach, gdy pierwszym ruchem w grze podwójnej jest proces ustalania cen na 1 Sytuacje, w których dwa procesy przebiegają jednocześnie uznać można za szczególny przypadek gry poje- dynczej [9, 11]. x rynku detalicznym przez danego gracza, np. A. W tej sytuacji, podejmując decyzję wyboru określonej strategii gry, gracz ten musi się liczyć z tym, że ostateczny wynik gry znany będzie dopiero po ustaleniu strategii przez dwóch pozostałch graczy: H i B. Znamienne jest to, iż gracz A ma dość ograniczony wpływ na decyzję gracza H i praktycznie nie ma go w przypadku gracza B. W tym sensie sytuacja ta jest zbliżona do gry w której udział bierze trzech graczy, co stanowi najprostszy przypadek gry wieloosobowej. Rozpatrywane w niniejszej pracy przypadki stanowią też zalążek analizy gier wielokryterialnych. Jest tak pomimo faktu, iż w rzeczywistości gracze biorą udział w grze jednokryterialnej, rozumianej jako takie w tym sensie, że rozpatrują tylko jedną własną funkcję wypłaty, np. zysk lub udział w rynku. Element wielokryterialności pojawia się jednakże w kontekście definicji celu, do jakiego gracze mogą dążyć. Cel ten w szczególności obejmuje nie tylko stosunek do własnej funkcji wypłaty (zasadniczo jego maksymalizację), ale również stosunek do funkcji wypłaty drugiego gracza. Objawia się to w szczególny sposób wówczas, gdy gracze zmierzają do celów antagonistycznych próbując z jednej strony maksymalizować wartość własnej funkcji wypłaty, a z drugiej w jakiejś mierze minimalizować wartość funkcji wypłaty drugiego gracza. Odnaleźć więc tu można swoistą analogię do przypadku gry, w której gracz kieruje się optymalizacją dwóch własnych funkcji wypłaty, np. zysku (kryterium maksymalizowane) i ponoszonych kosztów (kryterium minimalizowane), co stanowi najprostszy przypadek gry wielokryterianej. xi xii Rozdział 1 Analiza zależności pomiędzy ustaloną, a preferowaną kolejnością ruchów w grze pojedynczej Rozpatrujemy przypadek, w którym kolejność graczy jest z góry ustalona i niemożliwa do zmiany. W grze podwójnej będziemy więc mieli sześć sekwencji ruchów graczy: ABH, AHB, BAH, BHA, HAB, HBA. Ponieważ w wyniku ustalenia ceny na jednym z rynków sytuacja decyzyjna przekształca się z gry podwójnej w grę pojedynczą [9, 11], pierwszy ruch w grze podwójnej równoznaczny jest z wyborem gry, w jaką gracze grali będą w grze pojedynczej. Pierwszy ruch w grze podwójnej umożliwia więc danemu graczowi odpowiednie ukształtowanie struktury gry pojedynczej. Pierwszy ruch w grze podwójnej traktować zatem należy jako pozycję w tym sensie uprzywilejowaną. Z punktu widzenia gracza A uszeregowania BAH i BHA mogą być rozpatrywane jako gra pojedyncza (AH i HA), bowiem dla niego gra rozpoczyna się dopiero od momentu, gdy gracz B ustali już swoje ceny na rynku detalicznym (B)1 . W pozostałych przypadkach, a więc AHB, HAB, ABH i HBA w pierwszym ruchu gracz A ma możliwość określenia (przypadki AHB i ABH) lub wpłynięcia na określenie (przypadki HAB i HBA) rodzaju gry, jaka będzie rozgrywana w drugiej fazie – rodzaj gry pojedynczej. Wcześniejsze analizy [9] doprowadziły nas do sformułowania pojęć: gry z preferencją pierwszego oraz gry z preferencją drugiego. Gra z preferencją pierwszego to gra, w której w sytuacji, gdy obaj gracze rozgrywają grę o sumie niezerowej (znają nawzajem swoje macierze wypłat), korzystnie dla obu jest ruszyć się jako pierwszy. Gra z preferencją drugiego zaś, to gra, w której 1 Jest to stwierdzenie prawdziwe przy założeniu, że gracz A nie może bezpośrednio lub pośrednio wpływać na decyzje cenowe gracza B na rynku detalicznym. 1 2 ROZDZIAŁ 1. ANALIZA ZALEŻNOŚCI POMIĘDZY USTALONĄ, A PREFEROWANĄ KOLEJNOŚCIĄ RUCHÓW W GRZE POJEDYNCZEJ w sytuacji, gdy obaj gracze rozgrywają grę o sumie niezerowej, korzystniej dla obu jest ruszyć się jako drugi. Wobec powyższego można by przypuszczać, iż dla dla uszeregowań AHB oraz HAB celem gracza A winien być taki wybór strategii gry w pierwszym ruchu (ai dla przypadku AHB i hl dla przypadku HAB), który doprowadzi do uzyskania w drugiej fazie gry (gry pojedynczej) gry z preferencją pierwszego, czyli sytuacji, w której dla obu graczy korzystniej byłoby ruszyć się jako pierwszemu. Zaś dla uszeregowań ABH oraz HBA celem gracza A winien być taki wybór strategii gry w pierwszym ruchu (ai dla przypadku ABH i hl dla przypadku HBA), który doprowadzi do uzyskania w drugiej fazie gry (gry pojedynczej) gry z preferencją drugiego, czyli sytuacji, w której dla obu graczy korzystniej byłoby ruszyć się jako drugi2 . Jest to jednakże intuicja błędna, co zostanie wykazane na poniższym przykładzie Przykład 1.1 Rozważmy przykład, w którym kolejność ruchów graczy jest ustalona w następujący sposób: HAB. Pierwszym ruchem w grze są więc negocjacje stawek rozliczeniowych (ruch hipotetycznego gracza H), po którym rozgrywana ma być gra pojedyncza (AB), w której najpier gracz A ustala swoje ceny na rynku detalicznym (A), a następnie ceny te ustala gracz B (B). Intuicja podpowiada, że ponieważ w grze pojedynczej (AB) gracz A będzie musiał wykonać ruch jako pierwszy, w trakcie negocjacji cen na rynku hurtowym (ruch gracza H) powinien dążyć do wyboru takiej strategii hl , która ukształtuje przyszłą grę pojedynczą, jako grę z preferencją pierwszego. Rozważmy macierz wypłat graczy jak w tabeli 1.1. Tabela 1.1: Macierz wypłat graczy A i B w grze podwójnej, w której opłaca się graczowi A ukształtować grę pojedynczą, jako grę z preferencją drugiego. h1 h2 b1 b2 a1 [3,3] [2,4] a2 [4,2] [1,1] b1 b2 a1 [6,5] [5,6] a2 [5,6] [6,5] Jeśli w trakcie negocjacji zostanie wybrana strategia h1 , wówczas w grze pojedynczej rozgrywana będzie gra z macierzą wypłat jak w tabeli 1.2. Jeśli w trakcie negocjacji zostanie wybrana 2 Przypuszczenie to wynika z faktu wyraźnie i nieodwołalnie ustalonej kolejności ruchów graczy. Nakreślane tu intuicyjne przypuszczenie sugeruje, że graczowi A winno zależeć na takim ukształtowaniu gry pojedynczej, w której preferowana kolejność ruchów odpowiadała będzie kolejności ustalonej. 3 strategia h2 , wówczas w grze pojedynczej rozgrywana będzie gra z macierzą wypłat jak w tabeli 1.3. Tabela 1.2: Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w grze podwójnej została wybrana strategia h1 . b1 b2 a1 [3,3] [2,4] a2 [4,2] [1,1] Tabela 1.3: Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w grze podwójnej została wybrana strategia h2 . b1 b2 a1 [6,5] [5,6] a2 [5,6] [6,5] Gra z macierzą wypłat jak w tabeli 1.2 jest grą z preferencją pierwszego, zaś gra z macierzą 1.3 grą z preferencją drugiego. Widać jednakże, iż nawet przy założeniu, iż w grze pojedynczej gracz A musi wykonać ruch jako pierwszy, korzystniej dla niego jest rozgrywać grę 1.3. Grając w grę 1.2 gracz A może zapewnić sobie maksymalną wypłatę równą V1A (a2 ) = 4, jeśli wybierze strategię a2 , a w odpowiedzi gracz B wybierze strategię b1 , maksymalizującą jego wypłatę V2B (bj ), dla ustalonej strategii gracza A. Grając zaś w grę 1.3 gracz A (przy konieczności wykonania ruchu jako pierwszy) zapewnić sobie może wypłatę równą conajmniej 5, niezależnie od tego, jaką wybierze strategię. Widać więc, iż mimo konieczności wykonywania ruchu jako pierwszy w grze pojedynczej, graczowi A może opłacać się zabiegać o to, by w trakcie negocjacji wybrana została taka strategia (hl ), która doprowadzi do sformułowania gry pojedynczej, jako gry z preferencją drugiego. W analogiczny sposób wykazać można, iż w przypadku, gdy w grze pojedynczej gracz A musiałby ruszyć się jako drugi (np. sekwencja BA), korzystniej może być dla niego wybrać taką strategię w grze podwójnej (hl w grze HBA), która doprowadzi do konieczności rozgrywania w drugiej fazie (gra pojedyncza) gry z preferencją pierwszego. 4 ROZDZIAŁ 1. ANALIZA ZALEŻNOŚCI POMIĘDZY USTALONĄ, A PREFEROWANĄ KOLEJNOŚCIĄ RUCHÓW W GRZE POJEDYNCZEJ Przykład 1.2 Załużmy, że macierz wypłat przedstawia się jak w tabeli 1.4, a kolejność ruchów określona jest przez sekwencję HBA. Tabela 1.4: Macierz wypłat graczy A i B w grze podwójnej, w której opłaca się graczowi A ukształtować grę pojedynczą, jako grę z preferencją pierwszego. h1 h2 b1 b2 a1 [4,4] [3,5] a2 [5,3] [2,2] b1 b2 a1 [2,1] [1,2] a2 [1,2] [2,1] Jeśli w trakcie negocjacji zostanie wybrana strategia h1 , wówczas w grze pojedynczej rozgrywana będzie gra z macierzą wypłat jak w tabeli 1.5. Jeśli w trakcie negocjacji zostanie wybrana strategia h2 , wówczas w grze pojedynczej rozgrywana będzie gra z macierzą wypłat jak w tabeli 1.6. Tabela 1.5: Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w grze podwójnej została wybrana strategia h1 . b1 b2 a1 [4,4] [3,5] a2 [5,3] [2,2] Tabela 1.6: Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w grze podwójnej została wybrana strategia h2 . b1 b2 a1 [2,1] [1,2] a2 [1,2] [2,1] Gra z macierzą wypłat jak w tabeli 1.5 jest grą z preferencją pierwszego, zaś gra z macierzą 1.6 grą z preferencją drugiego. Widać jednakże, iż nawet przy założeniu, iż w grze pojedynczej 5 gracz A musi wykonać ruch jako drugi, korzystniej dla niego jest rozgrywać grę 1.5. Grając w grę 1.6 gracz A może zapewnić sobie maksymalną wypłatę równą 2, niezależnie od tego, jaką strategię w pierwszym ruchu wybierze gracz B. Grając zaś w grę 1.5 gracz A może sobie zapewnić wypłatę równą conajmniej 3. Widać więc, iż mimo konieczności wykonywania ruchu jako drugi w grze pojedynczej, graczowi A może opłacać się zabiegać o to, by w trakcie negocjacji wybrana została taka strategia (hl ), która doprowadzi do sformułowania gry pojedynczej, jako gry z preferencją pierwszego. Rzecz jasna zachodzić mogą również przypadki, w których ustalona kolejność ruchów graczy pokrywać się będzie – z punktu widzenia gracza A – z preferencją ruchów w grze pojedynczej. Przykład 1.3 Rozważmy przykład, w którym kolejność ruchów graczy jest ustalona w następujący sposób: HAB. Załużmy, że macierz wypłat graczy przedstawia się jak w tabeli 1.7. Tabela 1.7: Macierz wypłat graczy A i B w grze podwójnej, w której opłaca się graczowi A ukształtować grę pojedynczą, jako grę z preferencją pierwszego. h1 h2 b1 b2 a1 [4,4] [3,5] a2 [5,3] [2,2] b1 b2 a1 [2,1] [1,2] a2 [1,2] [2,1] Jeśli w trakcie negocjacji zostanie wybrana strategia h1 , wówczas w grze pojedynczej rozgrywana będzie gra z macierzą wypłat jak w tabeli 1.8. Jeśli w trakcie negocjacji zostanie wybrana strategia h2 , wówczas w grze pojedynczej rozgrywana będzie gra z macierzą wypłat jak w tabeli 1.9. Gra z macierzą wypłat jak w tabeli 1.8 jest grą z preferencją pierwszego, zaś gra z macierzą 1.9 grą z preferencją drugiego. W tym przypadku opłaca się graczowi A zabiegać, by w trakcie negocjacji została wybrana strategia h1 co doprowadzi do ukształtowania gry pojedynczej, jako gry z preferencją pierwszego (tabela 1.8), co jest zgodne z ustaloną kolejnością ruchów (HAB), w ramach której w grze pojedynczej (AB) gracz A wykonywał będzie ruch jako pierwszy. W przypadku rozgrywania gry z macierzą wypłat jak w tabeli 1.8, gracz A zapewnić sobie może wypłatę równą conajmniej 3, jeśli wybierze strategię a1 , a przy założeniu, że gracz B w swych decyzjach 6 ROZDZIAŁ 1. ANALIZA ZALEŻNOŚCI POMIĘDZY USTALONĄ, A PREFEROWANĄ KOLEJNOŚCIĄ RUCHÓW W GRZE POJEDYNCZEJ Tabela 1.8: Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w grze podwójnej została wybrana strategia h1 . b1 b2 a1 [4,4] [3,5] a2 [5,3] [2,2] Tabela 1.9: Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w grze podwójnej została wybrana strategia h2 . b1 b2 a1 [2,1] [1,2] a2 [1,2] [2,1] kierował się będzie wyłącznie maksymalizacją własnej funkcji wypłaty, gracz A zapewnić sobie może wypłatę równą 5 jeśli wybierze strategię a2 . W przypadku gry z macierzą wypłat jak w tabeli 1.9 gracz A spodziewać się może wypłaty równej 1. Łatwo podać analogiczny przykład, dla przypadku, gdy gracz A w grze pojedynczej musi wykonać ruch jako drugi. Analogicznej różnorodności przypadków spodziewać się należy również z punktu widzenia gracza B. Z powyższych rozważań wynika twierdzenie, iż pomiędzy dwoma celami wyboru strategii gry w grze podwójnej: ustaleniem preferencji ruchów w grze pojedynczej zgodnej z ustaloną kolejnością ruchów oraz maksymalizacja (optymalizacja) własnej funkcji wypłat – może, lecz nie musi zachodzić zbieżność. W szczególnych przypadkach (przykłady 1.1 i 1.2) cele te mogą być sprzeczne (strategia maksymalizująca wartość funkcji wypłaty może prowadzić do ukształtowania gry pojedynczej, jako gry z preferencją kolejności ruchów niezgodną – z punktu widzenia danego gracza – z kolejnością ustaloną). Łatwo wykazać, iż analogiczna zbieżność lub sprzeczność zachodzić może w przypadku gracza B. Rozdział 2 Ustalona kolejność ruchów – gracz A zna sposób rozegrania gry pojedynczej przez gracza B Rozważamy przypadek, gdy w grze podwójnej gracz A wykonuje ruch jako pierwszy1 (czy to w sensie ustalenia cen na rynku detalicznym A, czy w sensie negocjowania cen na rynku hurtowym H). Wybór określonej strategii gry gracz A uzależnia od celu, jaki chce osiągnąć, jak również od przewidywanego sposobu rozegrania gry przez gracza B (jego celu). W szczególności cele te mogą polegać na dążeniu do maksymalizacji (ogólnie optymalizacji) własnej funkcji wypłaty, który określimy jako cel indywidualnie efektywny i/lub na dążeniu do pogorszenia wartości wypłaty drugiego gracza (cel antagonistyczny [9]). Wybór strategii gry w grze podwójnej jest równoznaczny z wyborem gry, jaką gracze rozegrają w drugiej fazie, co określić można jako wybór struktury2 gry pojedynczej. W przypadku gdy gracz A jest w stanie przewidzieć sposób rozegrania gry pojedynczej przez obu graczy (rozumiany jako cel do jakiego dążą – indywidualnie efektywny lub antagonistyczny), co równoznaczne jest z możliwością przewidzenia wybranych przez nich strategii, a więc i precyzyjnego określenia wyniku gry, wybór strategii gry w grze podwójnej jest zadaniem prostym: gracz A powinien wybrać taką strategię w pierwszym ruchu gry podwójnej, która będzie prowadziła do uformowania takiej gry pojedynczej, której wynik rozegrania będzie z jego punktu widzenia najbardziej korzystny. Sytuacja ulegnie skomplikowaniu wówczas, gdy gracz A nie będzie w stanie 1 Zgodnie z wcześniejszym ustaleniem przypadek, gdy gracz B rusza się jako pierwszy w grze podwójnej (sekwencje BAH i BHA) traktowany może być z punktu widzenia gracza A jako gra pojedyncza (odpowiednio AH i HA), bowiem dopiero w grze pojedynczej gracz A może wykonać pierwszy rych. 2 Rozumianej jako macierz wypłat graczy w tej grze. 7 ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY POJEDYNCZEJ PRZEZ GRACZA B 8 precyzyjnie określić, jaką strategię gry przyjmie w grze pojedynczej gracz B. Oba przypadki rozpatrzymy osobno. Przez sposób rozegrania gry pojedynczej rozumiemy cel, do jakiego dążą gracze w trakcie rozgrywania gry. W szczególności cel ten może być celem indywidualnie efektywnym, czyli opartym o zasadę optymalizacji własnej funkcji wypłaty, bądź też celem antagonistycznym, nastawionym w jakiejś mierze na pogorszenie wartości wypłaty drugiego gracza. W przypadku, gdy któryś z graczy dążył będzie do realizaji celu antagonistycznego przyjmiemy, iż znajomość sposobu rozegrania gry oznacza znajomość konkretnej strategii antagonistycznej, jaką będzie się on kierował3 . W związku z tym, poza przypadkami niejednoznacznych strategii [9], znajomość celu, do jakiego dąży gracz B pozwala graczowi A w sposób jednoznaczny określić strategię bj , jaką gracz B wybierze w trakcie rozgrywania gry pojedynczej. Racjonalny sposób rozegrania gry podwójnej przez gracza A w przypadku, gdy zna on cel do jakiego dążył będzie gracz B rozważymy w dwóch osobnych przypadkach: • Pierwszym ruchem w grze podwójnej jest proces negocjacji stawek rozliczeniowych na rynku hurtowym – H • Pierwszym ruchem w grze podwójnej jest proces ustalania cen na rynku detalicznym gracza A 2.1 Pierwszym ruchem w grze podwójnej jest proces negocjacji stawek rozliczeniowych na rynku hurtowym – H W przypadku, gdy pierwszym ruchem w grze podwójnej jest proces negocjacji H, w grze pojedynczej będziemy mieli do czynienia z dwoma przypadkami: AB i BA. Przy założeniu, że gracz A zna sposób rozegrania gry przez gracza B (cel do jakiego będzie on dążył), dla przypadku AB gracz A może jednoznacznie ustalić, jaką strategię bj w grze pojedynczej wybierze gracz B. Wynika to z faktu, że decyzja na rynku detalicznym gracza B będzie ostatnim ruchem w grze, a zatem ustalone już będą strategie hl oraz ai , przez co łatwo będzie przełożyć cel gry gracza B, na konkretną strategię bj . Sytuacja będzie jednakże już trudniejsza, jeśli pierwszym ruchem w grze pojedynczej będzie B. W tej sytuacji jednoznaczne przełożenie celu do jakiego dąży gracz B na konkretną strategię 3 Np. dążenie do uzyskania optymalnej wartości własnej wypłaty przy jednoczesnym możliwie dużym pogorsze- niu wypłaty drugiego gracza, dążenie do utrzymania wartości własnej wypłaty na określonym poziomie przy jednoczesnym możliwie dużym pogorszeniu wypłaty drugiego gracza, dążenie do uzyskania maksymalnej różnicy pomiędzy własną wartością wypłaty, a wypłatą drugiego gracza, czy wreszczie dążenie do maksymalnego pogorszenia wartości wypłaty drugiego gracza (na temat strategii antagonistycznych patrz [9]). 2.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 9 bj możliwe jest jedynie wówczas, gdy gracz b wie, do jakiego celu dąży gracz A. Jeśli gracz B tego celu nie zna, jego wybór określonej strategii bj zależny będzie od tego, co myśli o tym, co zrobi gracz A. W ogólności więc jego wybór określonej strategii bj nie będzie już tak jednoznaczny, jak w przypadku, w którym proces B miałbyć ostatnim ruchem w grze (przypadek HAB). Oba przypadki rozpatrzymy osobno. 2.1.1 W grze pojedynczej pierwszy rusza się gracz A (przypadek HAB) Jeśli pierwszym ruchem w grze podwójnej będzie proces negocjacji H, a pierwszym ruchem w grze pojedynczej ustalenie przez gracza A cen na rynku detalicznym wówczas gracz A może w sposób prosty przełożyć cel do jakiego dąży gracz B na konkretną strategię bj . Przy założeniu znajomości strategii bj , jaką gracz B wybierze w grze pojedynczej, gracz A może w sposób jednoznaczny określić wynik gry pojedynczej: wartości wypłaty obu graczy, jako wynik wyboru strategii bj przez gracza B i strategii ai przez gracza A, której znajomość dla A jest oczywista . W rozważanym przypadku struktura gry pojedynczej, czyli macierze wypłat graczy zależą od wybranej uprzednio strategii hl w ramach gry podwójnej, zatem wynik gry pojedynczej zależny jest od wybranej strategii hl . Określona gra pojedyncza jest zatem jedną z L gier, dostąpnych poprzez wybór określonej strategii hl . Wynik l-tej gry pojedynczej określimy więc jako [VlA , VlB ]. Proces decyzyjny gracza A w grze podwójnej, w przypadku znajomości sposobu rozegrania przez gracza B gry pojedynczej sprowadza się do wyboru takiej strategii hl (przy założeniu, że proces H jest pierwszym ruchem w grze), który prowadzi do najkorzystniejszego z punktu widzenia gracza A wektora wypłat [VlA , VlB ]. Jest to problem dwukryterialny. Gracz A rozegrać go może w sposób indywidualnie efektywny lub antagonistyczny. W przypadku rozegrania gry w sposób indywidualnie efektywny gracz A dążył będzie do wybrania takiej strategii ĥl , dla której zachodzi zależność: ĥl = arg max VlA . (2.1) l Rozgrywając grę w sposób antagonistyczny gracz A, wybór określonej strategii hl zależny będzie od siły nastawienia antagonistycznego gracza A. W sytuacji minimalnego antagonizmu gracz A dążył będzie do wyboru strategii: n o h̆l = arg lex max VlA , −VlB . l (2.2) W sytuacji maksymalnego antagonizmu zaś do wyboru strategii: n o h̆l = arg lex min VlB , −VlA . l (2.3) Przykłady innych (pośrednich) strategii antagonistycznych opisane zostały w pracy [9]. Opisane podejście zilustrujemy na przykładzie. 10 ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY POJEDYNCZEJ PRZEZ GRACZA B Przykład 2.1 Rozważmy przykład gry z macierzą wypłat jak w tabeli 2.1. Na rynku detalicznym gracza A dostępne są trzy strategie: a1 , a2 i a3 . Na rynku detalicznym gracza B również dostępne są trzy strategie: b1 , b2 i b3 . W ramach negocjacji stawek na rynku hurtowym dostępne są dwie strategie: h1 oraz h2 . Wymogi prawne, zawarte uprzednio umowy z użytkownikami końcowymi (na rynkach detalicznych) jak też dotychczasowa umowa interconnectowa wymuszają następującą kolejność ruchów w grze: HAB. Problem sformułować można w formie pytania: o wybór której ze strategii hl powinien zabiegać w trakcie negocjacji H gracz A wiedząc, iż gracz B w grze pojedynczej wybierze strategię minimalnie antagonistyczną postaci 2.3? Tabela 2.1: Macierz wypłat graczy A i B w grze podwójnej. h1 h2 b1 b2 b3 b1 b2 b3 a1 [2,1] [3,3] [2,3] a1 [2,1] [1,2] [3,2] a2 [2,2] [1,3] [3,1] a2 [3,2] [2,1] [2,2] a3 [3,2] [1,2] [2,1] a3 [2,1] [1,2] [2,2] Rozwiązywanie problemu rozpoczynamy od analizy każdej z gier pojedynczych. Jeśli w trakcie negocjacji stawek rozliczeniowych (w grze podwójnej) zostanie wybrana strategia h1 , wówczas macierz wypłat graczy w grze pojedynczej będzie miała postać jak w tabeli 2.2. Jeśli w grze Tabela 2.2: Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w trakcie negocjacji wybrana zostanie strategia h1 . b1 b2 b3 a1 [2,1] [3,3] [2,3] a2 [2,2] [1,3] [3,1] a3 [3,2] [1,2] [2,1] podwójnej wybrana zostanie strategia h2 , wówczas macierz wypłat w grze pojedynczej będzie miała postać 2.3. Dla uproszczenia grę pojedynczą, odpowiadającą wyborowi w grze podwójnej strategii h1 określimy jako – h1 , zaś grę odpowiadającą strategii h2 – h2 . 2.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 11 Tabela 2.3: Macierz wypłat graczy w grze pojedynczej w przypadku, gdy w trakcie negocjacji wybrana zostanie strategia h2 . b1 b2 b3 a1 [2,1] [1,2] [3,2] a2 [3,2] [2,1] [2,2] a3 [2,1] [1,2] [2,2] Wynik każdej z gier pojedynczych zależy nie tylko od strategii gracza B (cen na jego rynku detalicznym), ale również od strategii gracza A. Załóżmy, iż gracz A kierował się będzie również strategią minimalnie antagonistyczną, dążąc w pierwszej kolejności do maksymalizacji własnej funkcji wypłaty, a w przypadku niejednoznaczności, wybierze tę strategię, która da mniejszą wypłatę graczowi B. W pierwszej kolejności gracz A określa oczekiwany wynik każdej z gier pojedynczych hl . • Gra h1 W grze h1 , jeśli gracz A wybierze strategię a1 , gracz B wybierze strategię b3 i ustali się wynik [2, 3]. Jeśli gracz A wybierze strategię a2 , gracz B wybierze strategię b2 i ustali się wynik [1, 3]. Jeśli gracz A wybierze strategię a3 , gracz B wybierze strategię b2 i ustali się wynik [1, 2]. Wobec tego, kierując się strategią minimalnie antagonistyczną w grze h1 , gracz A wybrałby strategię a1 co dałoby wynik [2, 3]. • Gra h2 W grze h2 , jeśli gracz A wybierze strategię a1 , gracz B wybierze strategię b2 i ustali się wynik [1, 2]. Jeśli gracz A wybierze strategię a2 , gracz B wybierze strategię b3 i ustali się wynik [2, 2]. Jeśli gracz A wybierze strategię a3 , gracz B wybierze strategię b3 i ustali się wynik [2, 2]. Wobec tego, kierując się strategią minimalnie antagonistyczną w grze h1 , gracz A wybrałby strategię a2 , co dałoby wynik [2, 2]. Zakładając znajomość sposobu rozegrania każdej z gier pojedynczych przez gracza B gracz A może w sposób jednoznaczny określić spodziewany wynik każdej z nich. I tak w grze h1 gracz A spodziewa się wyniku [V1A , V1B ] = [2, 3], zaś w grze h2 wyniku [V2A , V2B ] = [2, 2]. Wobec tego, kierując się strategią minimalnie antagonistyczną postaci n o h̆l = arg lex max VlA , −VlB , l (2.4) gracz A dążył będzie do wybrania w trakcie negocjacji strategii h2 , co w wyniku rozegrania później gry h2 powinno doprowadzić do wyniku [V2A , V2B ] = [2, 2]. 12 ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY POJEDYNCZEJ PRZEZ GRACZA B W przedstawionym wyżej przykładzie założono, że w obu grach h1 i h2 gracz B dąży do tego samego celu: maksymalizacji własnej funkcji wypłaty, a w przypadku niejednoznaczności do minimalizacji wypłaty gracza A (strategia minimalnie antagonistyczna). Rzecz jasna tak być nie musi. Struktura (macierz wypłat) każdej z gier pojedynczych może zachęcać gracza B, do kierowania się różnymi kryteriami w każdej grze, bowiem dla każdej z nich współczynnik zachęty do gry w sposób antagonistycznych max = ΥB i ViAmax − ViAmin ViBmax − ViBmin , (2.5) czy też wyrażony w wartościach względnych max = Υ̃B i ViBmax · (ViAmax − ViAmin ) ViAmax · (ViBmax − ViBmin ) , (2.6) może przyjmować różną wartość [9]. Może to stanowić element przetargowy w trakcie negocjacji rozgrywanych w pierwszej fazie gry (w grze podwójnej). Gracz B może grozić graczowi A, iż w przypadku, gdy negocjacje zakończą się wybraniem określonej strategii hl , w odpowiadającej jej grze pojedynczej h2 gracz B kierował się będzie strategią wyjątkowo niekorzystną dla gracza A. Przykład 2.2 Rozważmy przykład gry z macierzą wypłat jak w tabeli 2.4. Załóżmy, iż kolejność ruchów graczy ustalona została w sposób niezależny od woli graczy, jako sekwencja HAB. Tabela 2.4: Macierz wypłat graczy A i B, której struktura umożliwia graczowi B stosowanie gróźb w trakcie negocjacji w grze podwójnej. h1 h2 b1 b2 a1 [1,4] [5,5] a2 [5,5] [1,4] b1 b2 a1 [4,6] [4,5] a2 [4,6] [4,5] Załóżmy ponadto, iż strategia h1 jest strategią rekomendowanych cen przez regulatora rynku, którą obaj gracze mogą w każdej chwili wybrać czy to na zasadzie wzajemnej decyzji, czy też na skutek arbitrażu regulatora. W przypadku gdy obaj gracze kierują się w swych decyzjach maksymalizacją własnej funkcji wypłaty (strategia indywidualnie efektywna), wybór strategii 2.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 13 h1 jest dla gracza A korzystny, bowiem spodziewanym wynikiem tej gry jest para: [V1A , V1B ] = [5, 5]. Z puntku widzenia gracza B byłoby jednak lepiej, gdyby w negocjacjach została wybrana strategia h2 , to bowiem zapewniłoby, iż wynikiem gry będzie para: [V2A , V2B ] = [4, 6], co jest dla gracza B rozwiązaniem korzystniejszym. W tej sytuacji gracz B może wysunąć groźbę, iż jeśli gracz A nie zgodzi się na ustalenie cen na rynku hurtowym na poziomie odpowiadającym strategii h2 , tylko zerwie negocjacje i odwoła się do arbitrażu regulatora, gracz B w grze h1 dążył będzie do ustalenia wyniku [V1A , V1B ] = [1, 4]. Należy stwierdzić, iż groźba ta jest dość wiarygodna, bowiem strata gracza B w rezultacie doprowadzenia do wyniku [V1A , V1B ] = [1, 4] jest znacząco mniejsze aniżeli strata gracza A. Gracz B ponadto może uczynić swoją groźbę bardziej wiarygodną, jeśli uda mu się jakimś sposobem zmienić wartość niektórych wypłat w grze h1 . Jeśli w grze h1 macierz wypłat przyjęłaby postać jak w tabeli 2.5, wówczas groźba doprowadzenia do wyniku [V1A , V1B ] = [1, 4], byłaby o tyle wiarygodna, że gracz B na jej zrealizowaniu nic by nie tracił. V1B = 4 jest bowiem największą wartością jaką w tej grze gracz B może uzyskać. Tabela 2.5: Zmodyfikowana macierz wypłat w grze h2 . b1 b2 a1 [1,4] [5,4] a2 [5,4] [1,4] Prostą rzeczą byłoby podać przykład sytuacji, w której gracz B może wysuwać groźbę, jeśli w grze pojedynczej musiałby ruszyć się jako pierwszy. Struktura macierzy wypłat w grze pojedynczej może także inspirować graczy do składania obietnic w trakcie rozgrywania gry podwójnej, iż w przypadku wybrania określonej strategii w trakcie negocjacji, w grze pojedynczej nie będą grali w sposób antagonistyczny, lub też nawet, że zagrają w sposób altruistyczny, godząc sią na własną stratę z pewną korzyścią dla drugiego gracza. Przykład 2.3 Rozważmy przykład gry z macierzą wypłat jak w tabeli 2.6. Załóżmy, iż kolejność ruchów graczy ustalona została w sposób niezależny od woli graczy, jako sekwencja HAB. Załóżmy ponadto, iż strategia h1 jest strategią rekomendowaną przez regulatora. Wynikiem maksymalizującym wypłatę obu graczy jest tu wynik [V2A , V2B ] = [5, 5], który ustali się wówczas, gdy w 14 ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY POJEDYNCZEJ PRZEZ GRACZA B Tabela 2.6: Macierz wypłat graczy A i B, której struktura umożliwia graczowi B stosowanie gróźb w trakcie negocjacji w grze podwójnej. h1 h2 b1 b2 a1 [4,4] [4,4] a2 [4,4] [4,4] b1 b2 a1 [5,1] [5,1] a2 [5,5] [5,5] ramach gry pojedynczej gracze rozegrają grę h2 i gracz A wybierze strategię a2 . Słusznie jednak gracz B może się obawiać, iż jeśli w trakcie negocjacji zostanie wybrana strategia h2 , gracz B zagra w sposób antagonistyczny i – nic na tym nie tracąc – wybierze strategię a1 , co doprowadzi do najgorszego w całej grze wyniku dla gracza B. W tej sytuacji gracz B może preferować wybór strategii h1 co da mu pewną wypłatę równą 4. Jeśli tylko gracz A dąży do maksymalizacji własnej funkcji wypłaty, korzystnym jest dla niego złożyć w trakcie negocjacji (w grze podwójnej) obietnicę, iż jeśli tylko gracz B zgodzi się na wybór strategii h2 , on w grze pojedynczej wybierze strategię a2 . Wiarygodność takiej obietnicy zwiększy się wówczas, gdy gracz A jakimś sposobem zmodyfikuje swoją macierz wypłat tak, by wybór strategii a1 był i dla niego niekorzystny. Przykładowa modyfikacja macierzy wypłat z gry h2 podana jest w tabeli 2.7. Tabela 2.7: Zmodyfikowana macierz wypłat w grze h2 . b1 b2 a1 [1,1] [1,1] a2 [5,5] [5,5] Obietnica wyboru strategii a2 w grze h2 byłaby wręcz konieczna wówczas, gdyby macierz wypłat w grze h2 przedstawiała się jak w tabeli 2.8. W tej sytuacji gracz B dążył będzie do wyboru w grze podwójnej strategii h1 , słusznie obawiając się, że w grze h2 gracz A wybierze niekorzystną dla niego strategię a1 . W tej sytuacji w interesie gracza A jest złożyć obietnicę, iż w przypadku rozgrywania gry h2 wybierze strategię a2 . Deklaracja wyboru strategii a2 w grze h2 jest w istocie deklaracją rozegrania gry h2 w sposób altruistyczny, bowiem strategia a2 jest dla gracza A w tej grze gorsza aniżeli strategia a1 . Jest to jednakże posunięcie korzystne, bowiem prowadzi do wyniku lepszego ([5, 5]), niż w przypadu 2.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 15 Tabela 2.8: Macierz wypłat w grze, w której gracz A powinien złożyć obietnicę, iż w przypadku wybrania strategii h2 , wybierze strategię a2 . h1 h2 b1 b2 a1 [4,4] [4,4] a2 [4,4] [4,4] b1 b2 a1 [6,1] [6,1] a2 [5,5] [5,5] rozgrywania gry h1 ([4, 4]). Zarówno wysuwanie gróźb jak i składanie obietnic w grze podwójnej, w której toczą się negocjacje może być posunięciem wiarygodnym, który doczekałby się spełnienia jeśli zaszłyby określone warunki, jak też zwykłym blefem. Z tym faktem gracze powinni się liczyć. Wiarygodność ta wzrasta wówczas, gdy macierz wypłat gracza wysuwającego groźbę lub składającego obietnicę zostaje zmodyfikowana w sposób podobny jak w przypadku macierzy 2.5 oraz 2.7, kiedy to dotrzymanie groźby lub obietnicy przestaje wiązać się ze stratą gracza, który je wysuwa. 2.1.2 W grze pojedynczej pierwszy rusza się gracz B (przypadek HBA) Przypadek, w którym w grze pojedynczej pierwszy ruch wykona gracz B jest dla gracza A trudniejszy z punktu widzenia analizy przeprowadzanej w grze podwójnej. Wynika to z faktu, iż znajomość celu (indywidualnie efektywnego lub antagonistycznego), do jakiego dążył będzie gracz B nie daje się w każdym przypadku przełożyć w sposób jednoznaczny na wybór konkretnej strategii bj . Byłoby to możliwe jedynie wówczas, gdy gracz B znałby sposób rozegrania gry pojedynczej przez gracza A, a więc wiedział, jak na jego strategię bj odpowie gracz A. Z punktu widzenia rozgrywania gry podwójnej wartym rozważenia przez gracza A jest więc przekazanie przez niego informacji graczowi B na temat planowanego sposobu rozegrania określonej gry pojedynczej. Jest z resztą ku temu znakomita sposobność, w trakcie przeprowadzania w grze podwójnej procesu negocjacji H. W ten sposób, składając w trakcie negocjacji obietnice i/lub groźby wyboru określonych strategii ai w odpowiedzi na dane strategie bj , gracz A może nie tylko pozbywać się niepewności, odnośnie tego, którą strategię w grze pojedynczej wybierze gracz B, ale jednocześnie ułatwiać sobie wybór określonych strategii hl w grze podwójnej. W tej sytuacji kluczową kwestią staje się wiarygodność składanych obietnic i gróźb oraz podatność gracza B na to, by w nie uwierzyć. 16 ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY POJEDYNCZEJ PRZEZ GRACZA B Warto w tym miejscu podkreślić, iż termin obietnica jest w tym miejscu pojęciem bardziej ogólnym, aniżeli używano go dotychczas. W dotychczasowych rozważaniach terminu obietnica używaliśmy w kontekście, gdy dany gracz (A) zobowiązywał się do wyboru określonej strategii, jeśli tylko drugi gracz (B) wybrałby pożądaną przez niego strategię. Owo zobowiązanie kryło w sobie pewną stratę, którą gracz składający obietnicę zobowiązywał się ponieść. Było to o tyle sensowne, że gdyby takiej obietnicy nie złożył, drugi gracz (B) wybrał by inną strategię, która w efekcie dała by graczowi pierwszemu (A) wypłątę jeszcze gorszą. Użyte natomiast w tym miejscu słowo obietnica oznacza deklarację określonego sposobu rozegrania gry (być może różnego dla różnych strategii bj ), jednoznacznego poinformowania, którą ze strategii gracz A wybierze, dla każdej ze strategii bj (i to zarówno w przypadkach takich strategii bj , w przypadku których składanie obietnic rozumianych jak powyżej nie byłoby konieczne). Przykład 2.4 Załóżmy, że macierz wypłat graczy przedstawia się jak w tabeli 2.9. Kolejność ruchów graczy jest ustalona w sposób następujący HBA. O wybór której ze strategii hl winien zabiegać gracz A? Tabela 2.9: Macierz wypłat w grze z ustaloną kolejnością HBA. h1 h2 a1 a2 b1 [1,3] [3,4] b2 [2,2] [1,1] a1 a2 b1 [1,5] [4,4] b2 [3,1] [2,2] Aby odpowiedzieć na to pytanie, należy prześledzić możliwe sposoby rozegrania poszczególnych gier pojedynczych hl . W szczególności, należy odpowiedzieć na pytanie, którą ze strategii bj w każdej z gier pojedynczyh wybierze gracz B. Załóżmy, że gracz ten dąży do celu indywidualnie efektywnego, a więc zainteresowany jest wyłącznie maksymalizacją własnej funkcji wypłaty. Załóżmy też, iż takt ten jest znany dla gracza A. Rozważmy grę hl . Wyboru, której ze strategii bj powinien się tu spodziewać gracz A? Odpowiedź nie jest prosta i zależna jest od tego, co gracz B myśli na temat sposobu rozegrania gry przez gracza A. Jeśli założy, iż gracz A dążył będzie do celu indywidualnie efektywnego, lub minimalnie antagonistycznego, wówczas w interesie gracza B jest wybór strategii b1 , co sprawi, 2.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 17 że w odpowiedzi gracz A wybierze strategię a2 , przez co ustali się wynik [3, 4]. Co jednakże się stanie, jeśli gracz gracz B będzie przypuszczał, że gracz A zagra w sposób bardziej antagonistyczny? Wówczas uzasadnioną jest jego obawa, że w odpowiedzi na strategię b1 zostanie wybrana strategia a1 , co silniej pogorszy wypłatę gracza B, aniżeli gracza A (wynik [1, 3]). W tej sytuacji gracz B może być skłonny wybrać strategię b2 , ufając, że gracz A wybierze strategię b2 co doprowadzi do nieefektywnego wyniku [2, 2]. Jakiego sposobu rozegrania gry h2 przez gracza B może się spodziewać gracz A? Jeśli gracz A nie złoży wiarygodnej obietnicy wyboru strategii a2 w odpowiedzi na strategii b1 , wówczas z pewnością gracz B wybierze strategię b2 , co doprowadzi do wyniku [2, 2] (jeśli gracz A odpowie strategią a2 . Wynik ten nie jest efektywny. Widać zatem, iż w rozważanym przykładzie w interesie gracza A będzie poinformowanie gracza B o tym, które strategie zamierza wybrać, jako odpowiedź na poszczególne strategie bj 4 . Warto zwrócić uwagę na fakt, iż charakter obietnicy gracza A w obu grach: h1 i h2 będzie różny. W grze h1 obietnica wyboru strategii a2 w odpowiedzi na strategię b1 jest w istocie deklaracją, iż gracz A nie będzie chciał pogorszyć wypłaty gracza B (samemu nic na tym nie tracąc). Natomiast w grze h2 obietnica wyboru strategii a2 w odpowiedzi na strategię b1 jest już deklaracją zagrania w sposób, który przyniesie stratę (względem strategii a1 ) graczowi A, co jednocześnie przyniesie korzyść graczowi B. W pierwszym więc przypadku gracz A deklaruje rozegranie gry w sposób nie antagonistyczny, w drugim - w kontekście ustalonej strategii b1 - w sposób silnie altruistyczny. Jeśli więc przyjąć, iż gracz A dąży do celu indywidualnie efektywnego, to opłaca mu się poinformować gracza B, iż w obu grach w odpowiedzi na strategię b1 wybierze strategię a2 . W tym wypadku nie będzie dla niego miało znaczenia, która ze strategii hl zostanie w grze podwójnej wybrana5 . Jeśli gracz A dążył będzie do celu antagonistycznego wówczas winien zabiegać o wybór strategii h1 . Warto jednakże zauważyć, iż zabieganie o wybór strategii h1 jest dla gracza B jasnym komunikatem, iż gracz A dąży do celu antagonistycznego, a więc słusznie można się obawiać, iż w grze h1 w odpowiedzi na strategię b1 wybierze strategię a1 . W efekcie gracz B może nie być skłonny wybrać w tej grze strategii b1 . Widać zatem, iż w tym przypadku sama struktura gry podwójnej niejako utrudnia graczowi A rozgrywanie gry w sposób antagonistyczny. Teoretycznie taki sposób rozegrania gry jest tu możliwy, jednakże zabiegania o taką możliwość osłabia wiarygodność składanej przez gracza A obietnicy. 4 5 Zagadnienia roli informacji o macierzy wypłat i strategiach graczy omawiane już były w [5, 9]. Z punktu widzenia choćby dłuższej współpracy może się jednak okazać słusznym wybór strategii h2 , co da lepszy wynik graczowi B, bez straty dla gracza A. Będzie to na dodatek z punktu widzenia całej (podwójnej) gry - co w realnych warunkach rynkowych oznacza korzyść społeczną - wynik efektywny. ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY POJEDYNCZEJ PRZEZ GRACZA B 18 Dla odmiany, zabieganie o wybór strategii h2 , w pewnym sensie umacnia wiarygodność gracza A, a w tym również wiarygodność obietnicy wyboru strategii a2 w odpowiedzi na strategię b1 . Gracz B może jednakże się słusznie obawiać, że obietnica wyboru strategii a2 jest w istocie blefem, a deteminacja w dążeniu do wyboru w trakcie negocjacji strategii h2 jest w istocie wyrazem chęci uzyskania wyniku [1, 5]. Widać więc wyraźnie, iż niezależnie od kierunku starań gracza A w trakcie negocjacji H, gracz B może być skłonny wybrać strategię b2 . Krytyczną więc się staje kwestia wiarygodności składanych przez gracza A deklaracji. W jaki sposób winien rozgrywać grę podwójną gracz A jeśli uznaje, iż gracz B nie do końca wierzy jego obietnicom (choć ich prawdziwości nie wyklucza), a poprzez to niemożliwym jest jednoznaczne określenie, którą ze strategii bj gracz B wybierze? Warto w tym miejscu zauważyć, iż sytuacja, w której gracz A nie wie, jaką strategię w grze pojedynczej wybierze gracz B jest w sensie modelowym sytuacją analogiczną do tej, gdy w grze pojedynczej ustalane mają być ceny na rynku detalicznym gracza A oraz stawki rozliczeniowe na rynku hurtowym H. Wynika to z faktu, iż w tej drugiej sytuacji gracz A również nie wie, na jaką strategię w trakcie przeprowadzanych w grze pojedynczej negocjacji gracz B się zgodzi. Co więcej z faktu, że gracz A wie do jakiego celu dąży gracz B sytuację, w której ostatnim ruchem w grze jest proces A rozpatrywać można tak samo jak sytuację, w której ostatnim ruchem jest proces B, bowiem wybór określonej strategii ai przy ustalonym celu do jakiego dąży gracz A jest tak samo zdeterminowany, jak wybór określonej strategii bj , w przypadku, gdy znany dla gracza A jest cel do jakiego dąży gracz B. W ten sposób dochodzimy do wniosku, iż sytuację BA, w przypadku, gdy gracz A (mimo znajomości celu gracza B) nie potrafi jednoznacznie wskazać strategii, którą wybierze gracz B, możemy analizować w sposób identyczny (przy założeniu, że na rynku hurtowym nie ma strategii rekomendowanych, co łatwo uzyskać wykluczając z analizy tę strategię), jak sytuację HB, a więc sytuację, w której pierwszym ruchem w grze podwójnej jest proces ustalania cen na rynku detalicznym gracza A – AHB. Problem ten omawiamy w następnym punkcie. 2.2 Pierwszym ruchem w grze podwójnej jest proces ustalania cen na rynku detalicznym gracza A Jeśli pierwszym ruchem w grze podwójnej będzie wybór przez gracza A jego cen na rynku detalicznym ai , wówczas określenie a priori wyniku określonej gry pojedynczej (oznaczmy jako ai ) jest zagadnieniem bardziej złożonym. 2.2. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES USTALANIA CEN NA RYNKU DETALICZNYM GRACZA A 19 Pierwszym tego powodem jest trudność przewidzenia wyniku procesu negocjacji H, który odbywał się będzie w trakcie gry pojedynczej ai . Z problemem tym będziemy mieli do czynienia tak zarówno w przypadku, gdy pierwszym ruchem w grze pojedynczej będzie poces H jak też proces B. Znajomość celów, do jakich dążyli będą tu gracze nie przekłada się w sposób prosty na znajomość wyniku, jaki w rezultacie „starcia” tych dążeń się ustali. Gracz A może tu conajwyżej określić zbiór potencjalnie możliwych wyników danej gry pojedynczej, a następnie podejmując decyzję w trakcie rozgrywania gry podwójnej, dokonywać w rzeczywistości wyboru pomiędzy takimi zbiorami. Stosując strategię najbardziej zachowawczą, gracz A może przyjąć, iż wynikiem negocjacji będzię strategia rekomendowana przez regulatora h∗ (tę strategię obaj gracze zawsze mogą wybrać [6]). Uzyskany w ten sposób wynik gry pojedynczej gracz A zawsze może traktować jako wynik pewny. Przy takim podejściu problem decyzyjny gracz A w grze podwójnej traktować moża w sposób identyczny, jak to miało miejsce wówczas, gdy pierwszym ruchem w grze podwójnej były negocjacje (przypadek omówiony wyżej). Jeśli gracz A dopuszcza możliwość wyboru innej strategii gry w trakcie negocjacji, wówczas jego problem się komplikuje. W ogólności wybór określonej strategii ai w grze podwójnej wymagać będzie od gracza A porównywania nie tyle par pojedynczych wypłat obu graczy [VilA , VilB ], odpowiadających jednoznaczym wynikom A , V B ]]. gier pojedynczych ai ile porównania wektorów par wypłat [[Vi1A , Vi1B ], [Vi2A , Vi2B ], . . . , [ViL iL Jest to zatem problem wielokryterialny, a niepewność związana z wynikiem procesu negocjacji wprowadza niepewność w związku z ostateczym wynikiem gry. Druga trudność z określeniem wyniku określonej gry ai dotyczy przypadku, w którym pierwszym ruchem w grze pojedynczej będzie ustalenie przez gracza B cen na rynku detalicznym B (przypadek ABH). Wiąże się to z faktem, iż tym razem i gracz B w trakcie wyboru strategii bj będzie miał kłopot z określeniem, jaki będzie wynik, następującego potem procesu negocjacji, a co się z tym wiąże, z punktu widzenia gry podwójnej gracz A, mimo znajomości celu do jakiego dążył będzie gracz B nie jest w stanie jednoznacznie stwierdzić, jaką strategię bj wybierze w grze pojedynczej ai gracz B. 2.2.1 Metoda wyboru strategii Do rozwiązania problemu decyzyjnego w grze podwójnej gracz A zastosować może poniższą metodę: Metoda: Wybór strategii gry w grze podwójnej, w której pierwszym ruchem jest ustalenie cen na rynku detalicznym 1. Określenie dla każdej z gier ai zbioru możliwych wyników negocjacji (wybranych strategii hl 20 ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY POJEDYNCZEJ PRZEZ GRACZA B oraz odpowiadających im decycji na rynku detalicznym gracza B (bj ) oraz odpowiadających A , V B ]. im par wypłat [Vijl ijl A , V B ], odpowiada2. Stworzenie skalarnej miary oceny (VilA ) poszczególnych wyników gry [Vijl ijl jącej celowi, do jakiego dążył będzie gracz A (indywidualnie efektywny lub antagonistyczny) i przypisanie poszczególnym wynikom ich wartości wyznaczonej przez tą miarę. 3. Określenie pożądanego sposobu agregacji (agregacja względem strategii hl ) poszczególnych wartości skalarnych Υ(VilA ) i wybór określonej strategii ai dla której agregat przyjmuje wartość największą. Powyższa metoda wymaga szczegółowego omówienia. Omówienie metody: 1. Określenie dla każdej z gier ai zbioru możliwych wyników negocjacji (wybranych strategii hl oraz odpowiadających im decycji na rynku detalicznym gracza B (bj ) A , V B ]. oraz odpowiadających im par wypłat [Vijl ijl Osobnego omówienia wymagają tu dwa możliwe przypadki gier: przypadek AHB i ABH. Przypadek AHB W przypadku AHB pierwszym ruchem w grze pojedynczej (HB) są negocjacje stawek rozliczeniowych H. Znając sposób rozegrania gry przez gracza B (cel – inwywidualnie efektywny lub antagonistyczny – do jakiego będzie dążył), gracz A może dokładnie określić odpowiedź gracza B (bj ) na wybór określonej strategii hl w negocjacjach. W ten sposób jednoznacznie ustala się A , V B ]. wynik [Vijl ijl W sytuacji, gdy na rynku hurtowym istnieje strategia rekomendowanych cen h∗ gracz A dokonać może redukcji zbioru możliwych do wybrania w trakcie negocjacji strategii hl , poprzez odrzucenie tych strategii hl , które w ostateczności doprowadzą do wyniku gorszego dla gracza A lub gracza B niż by to było w przypadku wyboru strategii h∗ . W ten sposób rozmiar wektorów [ViA , ViB ] zostaje zredukowany. Rozważmy to na poniższym przykładzie. Przykład 2.5 Załóżmy, iż w danej grze pojedynczej macierz wypłat przedstawia się jak w tabeli 2.10. Pierwszym ruchem w grze jest proces negocjacji stawek rozliczeniowych HB. Załóżmy, że ustalając 2.2. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES USTALANIA CEN NA RYNKU DETALICZNYM GRACZA A 21 ceny na rynku detalicznym gracz B dążył będzie do maksymalizacji własnej funkcji wypłaty (cel indywidualnie efektywny). W trakcie negocjacji dostępna dla obu graczy jest strategia rekomendowanych cen h∗ . Tabela 2.10: Macierz wypłat w grze pojedynczej. b1 b2 h1 = h∗ [3,2] [2,3] h2 [3,1] [3,2] h3 [1,3] [3,1] h4 [3,7] [2,2] h5 [2,2] [4,4] Rozważmy, jakie wyniki ustalą się w rezultacie wybrania określonych strategii hl . • Jeśli w negocjacjach zostanie wybrana strategia h1 wówczas gracz B w odpowiedzi wybierze strategię b2 . Wynikiem będzie para [2, 3]. • Jeśli w negocjacjach zostanie wybrana strategia h2 wówczas gracz B w odpowiedzi wybierze strategię b2 . Wynikiem będzie para [3, 2]. • Jeśli w negocjacjach zostanie wybrana strategia h3 wówczas gracz B w odpowiedzi wybierze strategię b1 . Wynikiem będzie para [1, 3]. • Jeśli w negocjacjach zostanie wybrana strategia h4 wówczas gracz B w odpowiedzi wybierze strategię b1 . Wynikiem będzie para [3, 7]. • Jeśli w negocjacjach zostanie wybrana strategia h5 wówczas gracz B w odpowiedzi wybierze strategię b2 . Wynikiem będzie para [4, 4]. Wypłata jaką uzyska gracz B w rezultacie wybrania strategii h2 jest gorsza, aniżeli wypłata, jaką uzyskałby wybierając strategię rekomendowaną h1 (2 < 3). Analogicznie wypłata jaką uzyska gracz A w rezultacie wybrania strategii h3 jest gorsza, aniżeli wypłata, jaką uzyskałby wybierając strategię rekomendowaną h1 (1 < 2). Z tego też względu, analizując tę sytuację z punktu widzenia gry podwójenj (pierwszy rych w grze AHB) gracz A może przyjąć, iż ani h2 ani h3 nie zostaną w trakcie negocjacji H wybrane. Warto zauważyć, iż zarówno w przypadku wyboru strategii h4 jak też strategii h5 obaj gracze uzyskują wyniki lepsze niż w przypadku wybrania strategii cen rekomendowanych. Strategia cen 22 ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY POJEDYNCZEJ PRZEZ GRACZA B rekomendowanych h∗ nie jest tu więc strategią efektywną i słusznym wobec tego wydawać by się mogło jej odrzucenie z dalszej analizy. Jednakże z racji na względny rozkład wartości wypłat dla strategii h∗ , h4 i h5 wydaje się, że byłoby to posunięcie nieroztropne. Wynika to z faktu, iż każdy z graczy dążył będzie do wyboru innej strategii: gracz A do wyboru strategii h5 , zaś gracz B do wyboru strategii h4 , a przy tym obaj gracze będą mieli „słuszne” argumenty na rzecz preferowanej przez siebie opcji. Gracz A wybór strategii h5 popierać może argumentem, iż uzyskane w ten sposób wynik ([4, 4]) jest bliższy wynikowi odpowiadającemu strategii h∗ ([2, 3]) i że wybór strategii h4 doprowadziłby do nadmiernego faworyzowania gracza B, który miałby znacząco mocniejszy przyrost wypłaty (7−3 = 4) aniżeli gracz A (3−2 = 1). Gracz B natomiast argumentować może, że wynik ([4, 4]) doprowadzi do „niesprawiedliwego” zrównania wypłat graczy, co jest niezgodne z lepszą sytuacją gracza B, określoną wybore strategii rekomendowanej. Argumenty po obu stronach zdają się być słuszne i w przypadku nieustępliwości po obu stronach łatwo może dojść do pogorszenia wzajemnych stosunków i zerwania negocjacji, czego wynikiem będzie „wybór” strategii h∗ . Z perspektywy rozgrywania gry podwójnej AHB rozsądnym jest więc założenie, iż w rozpatrywanej wyżej grze pojedynczej wybrana może zostać jedna spośród strategii: h1 , h4 lub h5 , doprowadając w rezultacie do jednego z trzech wyników: [2, 3], [4, 4] lub [3, 7]. Wprzypadku gdy w grze pojedynczej negocjacje H poprzedzją decyzję na rynku detalicznym gracza B (przypadek HB) możemy mieć do czynienia z jeszcze jedną trudnością. Trudność ta związana jest ze stabilonościa celu do jakiego dąży gracz B. Stabilność ta bowiem zależeć może od sposobu przeprowadzenia procesu negocjacji. Słusznym wydaje się być przypuszczenie, iż jeśli nawet gracz B pierwotnie zamierzał (co było graczowi A wiadome) dążyć do realizacji celu indywidualnie efektywnego, to w przypadku agresywnego, nieuczciwego ([1, 2, 16, 18]) lub nadmienie nieustępliwego sposobu negocjawania przez gracza A, gracz B może mieć ochotę zmienić cel swojej gry na antagonistyczny. I odwrotnie, możliwa (conajmniej teoretycznie) jest sytacja, kiedy to początkowo antagonistyczne nastawienie gracza B zostanie złagodzone na skutek odpowiedniego sposobu negocjowania przez gracza A. Rozważmy poniższy przykład. Przykład 2.6 Rozważmy przykład gry pojedynczej z macierzą wypłat jak w tabeli: 2.11. Załóżmy, że pierwszym ruchem w grze jest są negocjacje stawek rozliczeniowych. Załóżmy też, iż przystępując do negocjacji gracz B zakłada rozgrywanie gry w sposób indywidualnie efektywny, co jest dla gracza A rzeczą wiadomą. 2.2. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES USTALANIA CEN NA RYNKU DETALICZNYM GRACZA A 23 Tabela 2.11: Przykład gry, w której decyzja gracza A prowokuje gracza B do zmiany celu z indywidualnie efektywnego na antagonistyczny. b1 b2 b3 h1 [1,1] [2,3] [5,10] h2 [4,5] [2,4] [0,3] Zakładając, iż wartości w macierzy wypłat są dla obu graczy porównywalne6 stwierdzić należy, iż struktura macierzy wypłat wyraźnie faworyzuje gracza B. W przypadku, gdyby obaj gracze dążyli do celu indywidualnie efektywnego powinien ustalić się wynik [5, 10], odpowiadający wyborowi strategii h1 i b3 . Gracz A może nie być pocieszony tak dużą różnicą wypłat, jaka przypadnie w efekcie każdemu z graczy i wobec tego może w trakcie negocjacji dążyć do wyboru strategii h2 , co w przypadku założenia, że jest to strategia rekomendowana przez regulatora może się okazać celem łatwo osiągalnym. Licząc na indywidualnie efektywny sposób rozegrania gry przez gracza B, gracz A spodziewał się będzie minimalnie gorszego wyniku dla siebie i znacząco gorszego dla gracza B – [4, 5], odpowiadającego strategiom h2 i b1 . W tym przypadku, oczywisty, choć w jakimś sensie uzasadniony antagonizm gracza A może okazać się prowokacją dla gracza B, do zmiany swego pierwotnego nastawienia i odpowiedzenia graczowi A również w sposób antagonistyczny poprzez wybór strategii b2 , lub nawet b3 , dając w efekcie graczowi A wypłatę równą co najwyżej 2, lub pozbawiając go wypłaty całkowicie7 . Zilustrowany w przykładzie 2.6 problem potraktować można albo jako przypadek, w którym sposób rozegrania gry przez gracza B uzależniony jest od wyniku negocjacji, przy czym sposób ten jest graczowi A znany (choć nie jest on stały, niezmienny, lecz uzależniony od konkretnej strategii hl ), albo jako przypadek, w którym gracz A nie zna sposobu rozegrania gry przez gracza B (celu, do którego dąży gracz B). Ten drugi przypadek omawiany będzie w następnym rozdziale. Przypadek ABH Przypadek ABH, w którym negocjacje są ostatnim ruchem w grze, jest przypadkiem trudniejszym do analizy z punktu widzenia gry podwójnej, w której ruch wykonuje gracz A. Wynika 6 Ta sama wartość liczbowa znaczy tyle samo dla każdego z graczy. W świetle teorii użyteczności jest to niewątpliwie założenie bardzo silne [?]. 7 Przy założeniu, że wypłaty przyjmują wyłącznie wartości nieujemne. 24 ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY POJEDYNCZEJ PRZEZ GRACZA B to z faktu, iż nie tylko gracz A nie zna potencjalnego wyniku negocjacji H ale również gracz B tego wyniku nie zna. W związku z tym, mimo znanego graczowi A celu (indywidualnie efektywnego lub antagonistycznego), do jakiego dążył będzie gracz B w grze pojedynczej, gracz A nie może w sposób jednoznaczny przełożyć tej wiedzy na konkretną strategię bj . Wynika to z faktu, iż cel, do jakiego dąży gracz B nie zawiera w sobie informacji, na temat jego stosunku do niepewności [13]. Rozsądnym podejściem jest więc założenie nieznajomości konkretnej decyzji detalicznej bj gracza B, jak też nieznajomości konkretnego wyniku negocjacji. Znajomość celu do jakiego dążył będzie gracz B mimo wszystko w wielu przypadkach pozwoli na częściowe zredukowanie zbioru możliwych wyników gry pojedynczej. Redukacja ta dokonywać się będzie na dwóch poziomach: 1. Dla każdej strategii bj wybór tylko takich strategii hl , które w rezultacie dadzą wynik niegorszy (dla obu graczy) niż strategia rekomendowana h∗ . 2. Odrzucanie tych strategii bj , które w sensie celu, do jakiego dąży gracz B są zdominowane przez inne strategie cen na rynku detalicznym gracza B. Realizacja punktu pierwszego jest zadaniem prostym i już omówionym w trakcie rozważania przypadku AHB. Realizacja punktu drugiego jest o wiele trudniejsza. Poza przypadkami, gdy dla danej strategii bj 0 wszystkie wypłaty gracza B są gorsze (a przy tym wszystkie wypłaty gracza A są lepsze) niż w przypadku wybrania innej strategii bj 00 , (dla każdej strategii hl ), co umożliwiałoby usunięcie z rozważań strategii bj 0 jako zdominowanej (niezależnie od celu – poza radykalnie altruistycznym – do jakiego dążył będzie gracz B) porównanie dwóch strategii bj wymaga w istocie zbudowania skalarnej miary oceny wyników otrzymanych przez obu graczy dla poszczególnych strategii hl . Dodaktowo jeszcze, z racji na niewiedzę, która ze strategii hl zostanie w trakcie negocjacji wybrana, porównanie dwóch strategii bj wymagałoby ponadto znajomości sposobu agregacji względem strategii hl wartości skalarnych odpowiadających poszczególnym wynikom gry, jaki gracz B przyjmie, co z punktu widzenia gracz A może się okazać niemożliwe. Tworzenie skalarnej miary oceny wyniku gry, jak też sposoby agregacji wartości skalarnych zostaną omówione w dwóch następnych punktach omówienia prezentowanej metody. Warto jeszcze zwrócić uwagę, iż sposób rozgrywania gry pojedynczej, czyli cel do jakiego dążył będzie gracz B w trakcie ustalania cen na rynku detalinczym B, może mieć wpływ na przebieg procesu negocjacji. Nie jest to już jednakże problem, nad którym kontrolę sprawować może gracz A. Jego udział w grze pojedynczej rozpoczyna się bowiem dopiero wówczas, gdy zaczną się negocjacje H, a to z jakim nastawieniem obu graczy się zaczną zależy już wyłącznie od detalicznej decyzji gracza B. Rzecz jasna gracz A ma w jakiejś mierze wpływ tak zarówno na detaliczną decyzję gracza B, jak też na jego nastawienie w trakcie procesu negocjacji H. Wpływ 2.2. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES USTALANIA CEN NA RYNKU DETALICZNYM GRACZA A 25 ten jednakże dokonuje się „z poziomu” gry podwójnej, nie zaś pojedynczej. Przy uszeregowaniu ABH decyzja na rynku detalicznym gracza A może dać graczowi B pewne informacje odnośnie tego, z jakim nastawieniem gracz A może przystąpić do negocjacji. Decyzja ta jednak może być również swoistym zaproszeniem „odpłacenia pięknym za nadobne”, w przypadku gdyby z punktu widzenia gracza B decyzja na rynku detalicznym ai gracza A została odebrana jako posunięcie antagonistyczne. Określając dostępne w ramach negocjacji strategie hl gracze muszą się również odnosić do kwestii siły negocjacyjnej graczy. Im siła ta będzie większa, tym uznać można, że większa cześć strategii hl – jednakże tylko takich, których wartość dla obu graczy jest niemniejsza niż wartość strategii h∗ – dostępna będzie dla gracza, który tę siłę posiada. Do określenia zbioru tych strategii zastosować można metody właściwe dla gier pojedynczych [9]. Omówienie metody: 2. Stworzenie skalarnej miary oceny (VilA ) poszczególnych wyników gry A , V B ], odpowiadającej celowi, do jakiego dążył będzie gracz A (indywidualnie efektywny lub [Vijl ijl antagonistyczny) i przypisanie poszczególnym wynikom ich wartości wyznaczonej przez tą miarę. Istotą tego punktu metody jest stworzenie narzędzia umożliwiającego skalarną ocenę dwuwartościowego wyniku gry [V A , V B ]. Innymi słowy szukamy funkcji odzworowującej punkty z dwuwymiarowej (wypłata gracza A i wypłata gracza B) przestrzeni wyników w wartości skalarne, których wartość odzwierciedlała będzie cel (indywidualnie efektywny lub antagonistyczny) do jakiego dążył będzie gracz, z puntku widzenia którego taka ocena wyniku jest realizowana8 . Poniżej podamy w sposób przykładowy możliwe do zastosowania miary oceny, dla omawianych we wcześniejszym opracowaniu [9] sposobów rozgrywania gry przez gracza A. • Cel indywidualnie efektywny W tym podejściu gracz A dąży wyłącznie do maksymalizacji własnej funkcji wypłaty ignorując wypłatę gracza B. Ten sposó rozegrania gry zapisać można jako następujące zadanie optymalizacji: n o ak = arg max V A (ai ) . i (2.7) Przy tak sformułowanym celu, gracz A ocenia dany wynik tym lepiej, im większą wartość przyjmuje jego wypłata. Stąd miarą oceny danego wyniku [V A , V B ] może być następująca 8 Omawiając metodę jesteśmy zainteresowani oceną z punktu widzenia gracza A. Gracz A jednakże może być również zainteresowany znajomością wartości oceny wyniku z punktu widzenia gracza B (patrze omówiony wcześniej przypadek ABH). 26 ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY POJEDYNCZEJ PRZEZ GRACZA B funkcja: V A [V A , V B ] = V A . (2.8) • Cel minimalnie antagonistyczny W tym podejściu gracz A dąży do maksymalizacji własnej funkcji wypłaty, a w przypadku niejednoznaczności wybiera tę strategię, która da najmniejszą wypłatę graczowi B. Ten sposó rozegrania gry zapisać można jako następujące zadanie optymalizacji: n o ak = arg lex max V A (ai ), −V B (ai ) . i (2.9) Przy tak sformułowanym celu gracza A, miara oceny danego wyniku [V A , V B ] może być sformułowana w sposób następujący: V A [V A , V B ] = wA · V A − wB · V B , (2.10) przy czym wA przyjmuje dużo większą wartość niż wB (wA wB ). • Cel maksymalnie antagonistyczny W tym podejściu gracz A dąży w pierszej kolejności do minimalizacji wartości wypłaty gracza B – V B , a w przypadku niejednoznaczności wybiera tę strategię, która da największą wypłatę V A . Ten sposó rozegrania gry zapisać można jako następujące zadanie optymalizacji: n o ak = arg lex min V B (ai ), −V A (ai ) . i (2.11) Przy tak sformułowanym celu gracza A, miara oceny danego wyniku [V A , V B ] może być sformułowana w sposób następujący: V A [V A , V B ] = wA · V A − wB · V B , (2.12) przy czym wA przyjmuje dużo mniejszą wartość niż wB (wA wB ). • Dążenie do uzyskania maksymalnej odległości pomiędzy wypłatami graczy Ten sposó rozegrania gry zapisać można jako następujące zadanie optymalizacji: n o ak = arg max V A (ai ) − V B (ai ) . i (2.13) Przy tak sformułowanym celu gracza A, miara oceny danego wyniku [V A , V B ] może być sformułowana w sposób następujący: V A [V A , V B ] = V A − V B . (2.14) 2.2. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES USTALANIA CEN NA RYNKU DETALICZNYM GRACZA A 27 • Dążenie do osiągniecia odpowiedniej różnicy wypłat graczy – δ, a po jej uzyskaniu do maksymalizacji własnej funkcji wypłaty Ten sposób rozegrania gry sformułować to można w postaci następującego zadania optymalizacji leksykograficznej: n o ak = arg lex max ∆i , V A (ai ) , (2.15) i gdzie: n o ∆i = min δ, V A (ai ) − V B (ai ) . Przy tak sformułowanym celu gracza A, miara oceny danego wyniku [V A , V B ] może być sformułowana w sposób następujący: V A [V A , V B ] = w∆ · ∆ + wA · V A , (2.17) przy czym w∆ wA . • Dążenie do maksymalizacji własnej funkcji wypłaty przy jednoczesnym dążeniu, by wartość wypłat gracza B nie przekroczyła pewnej wartości progowej ν Ten sposób rozegrania gry sformułować to można w postaci następującego zadania optymalizacji: n o ak = arg max V A (ai ) , (2.18) i przy ograniczeniu: V B (ai ) ¬ ν. Przy tak sformułowanym celu gracza A, miara oceny danego wyniku [V A , V B ] może być sformułowana w sposób następujący: n V A [V A , V B ] = wA · V A − wν · max ν, V B o (2.19) przy czym wA wν . • Dążenie do minimalizacji wartości wypłaty gracza B przy jednoczesnym dążeniu, by własna (V A ) wartość wypłaty nie przekroczyła pewnej wartości progowej ν Ten sposób rozegrania gry sformułować to można w postaci następującego zadania optymalizacji: n o ak = arg min V B (ai ) , i przy ograniczeniu: V A (ai ) ν. (2.20) 28 ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY POJEDYNCZEJ PRZEZ GRACZA B Przy tak sformułowanym celu gracza A, miara oceny danego wyniku [V A , V B ] może być sformułowana w sposób następujący: o n V A [V A , V B ] = wν · min ν, V A − wB · V B , (2.21) przy czym wν wB . • Strategia antagonistyczna wyrażona za pomocą pojęć metody punktu odniesienia Przy tym podejściu gracz A dąży do maksymalizacji własnej funkcji wypłaty, a jednocześnie minimalizacji wartości wypłaty gracza B, maksymalizując wartość odpowiedniej funkcji skalaryzującej, której parametrami sterującymi są punktu rezerwacji i aspiracji dla funkcji wypłaty zarówno gracza A jak i gracza B. Cząstkowa funkcja osiągnięcia dla (maksymalizowanej) funkcji wypłaty gracza A wyrażona będzie zależnością: ηA V A (ai ) = β(V A (ai )−V A ) dla V A (ai ) < V A A V −V A V A (ai )−V A dla V A ¬ V A (ai ) ¬ V A V 1+ −V A A α(V A (ai )−V ) dla V A V −V A Przy czym V A oznacza punkt rezerwacji, a V A A A (2.22) < V A (ai ) punkt aspiracji dla funkcji wypłaty V A (ai ) gracza A. Cząstkowa funkcja osiągnięcia dla (minimalizowanej) funkcji wypłaty gracza B wyrazi się zależnością: ηB V B (ai ) = 1+ B V α(V B (ai )−V B V −V (ai )−V B B ) dla V B (ai ) < V B dla V B V −V B β(V B (ai )−V B ) V B B B ¬ V B (ai ) ¬ V B (2.23) dla V B < V B (ai ) −V B Strategia antagonistyczna przybierze wówczas postać: ( ak = arg max i A B min ηA V (ai ) , ηB V (ai ) A B + ρ · ηA V (ai ) + ηB V (ai ) ) . (2.24) Przy tak sformułowanym celu gracza A, skalarna miara oceny danego wyniku [V A , V B ] może być sformułowana w sposób następujący: V A A B A B [V , V ] = min ηA V (ai ) , ηB V (ai ) A B + ρ · ηA V (ai ) + ηB V (ai ) . (2.25) 2.2. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES USTALANIA CEN NA RYNKU DETALICZNYM GRACZA A 29 Omówienie metody: 3. Określenie pożądanego sposobu agregacji (agregacja względem strategii hl ) poszczególnych wartości skalarnych Υ(VilA ) i wybór określonej strategii ai dla której agregat przyjmuje wartość najlepszą. W wyniku skalaryzacji wyników gry (punkt 2 omawianej metody) dla poszczególnych strategii hl otrzymujemy z wektora par wypłat (z wektora wyników gry odpowiadających poszczególnym strategiom hl ) wektor wartości skalarnych, odpowiadających celowi, do jakiego dąży gracz A9 – [V1A , V2A , . . . , VLA ]. Każdej, potencjalnie możliwej do wyboru (w trakcie rozgrywania gry A , V A , . . . , V A ], a zatem by ocenić daną podwójnej) strategii ai odpowiada wektor takich ocen [Vi1 i2 iL strategię (a co się z tym wiąże odpowiadającą jej grę pojedynczą) należy te wektory z sobą porównać. Porównanie to wymaga stworzenia zaagregowanej (skalarnej) miary, odzwierciedlającej stosunek gracza A do niepewności, związanej z możliwymi wynikami procesu negocjacji (H). W istocie problem decyzyjny gracza A przedstawić można w formie swoistej gry przeciwko naturze, w której strategiami gracza A są jego strategie cen detalicznych ai , a strategiami natury możliwe wyniki negocjacji hl (z uwzględnieniem redukcji liczby strategii hl przeprowadzonej w pierwszym punkcie omawianej metody). Wypłatami gracza A są tu skalarne wartości oceny VilA poszczególnych wyników [VilA , VilB ]. Ilustruje to w sposób przykładowy macierz wypłat z tabeli 2.12. Tabela 2.12: Ilustracja gry podwójnej, w której pierwszym ruchem jest ustalenie przez gracza A cen na rynku detalicznym, jako modelu gry przeciwko naturze, której strategiami są możliwe do przyjęcia przez obu graczy wyniki procesu negocjacji hl . h1 h2 h3 .. . h4 ··· ··· A V23 .. . .. . ··· a1 a2 a3 a4 Przy takim sformułowaniu, do rozwiązania problemu decyzyjnego gracza A w grze podwójnej, w której pierwszym ruchem jest ustalanie cen na rynku detalicznym przez gracza A zastosować można określone kryteria wyboru strategii w grze przeciwko naturze [3, 6, 7, 9, 10, 13, ?, 22]. W sposób przykładowy wymienimy tu kilka z nich. 9 Ewentualnie gracz B, jak to było sygnalizowane w przypadku ABH. ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY POJEDYNCZEJ PRZEZ GRACZA B 30 1. Kryterium Walda Υi (VilA ) = min VilA l ak = arg max Υi (VilA ). i (2.26) 2. Kryterium optymistyczne Υi (VilA ) = max VilA l ak = arg max Υi (VilA ). i (2.27) 3. Kryterium Laplace’a 1X A V . L l il Υi (VilA ) = ak = arg max Υi (VilA ). i (2.28) A , V A , . . . , V A ] dla różnych wartości i, a więc dla różnych Należy zwrócić uwagę, iż wektory [Vi1 i2 iL gier pojedynczych mogą mieć różne wymiary, z racji na początkową redukcję liczności zbioru potencjalnie możliwch do wyboru strategii hl . Z tego też względu do wyboru strategii ai nie należy stosować kryteriów, które wrażliwe są na liczbę rozpatrywanych strategii (np. kryterium sumy wypłat, jako uproszczona wersja wartości średniej użytej w kryterium Laplace’a). 2.2.2 Przykład zastosowania metody Użyteczność zaproponowanej metody omówimy na poniższym przykładzie. Przykład 2.7 Niezależny operator lokalny A od dłuższego czasu korzysta z oferowanej przez operatora zasiedziałego B usługi WLR10 do świadczenia usługi dostępu dla swoich użytkowników końcowych, fizycznie podłączonych do sieci operatora zasiedziałego oraz usług połączeniowych na zasadzie preselekcji. Mając w perspektywie rozbudowę własnej sieci do poziomu przełącznicy głównej MDF11 i co się z tym wiąże rezygnację z WLR na rzecz LLU12 , co zapewni mu większą kontrolę nad jakością oferowanych usług, operator A zamierza rozpocząć intensywną kampanię 10 11 12 Wholesale Line Rental. Message Distribution Frame. Local Loop Unbundling. 2.2. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES USTALANIA CEN NA RYNKU DETALICZNYM GRACZA A 31 reklamową, promującą nowy pakiet usług, w celu pozyskania nowych abonentów (dotychczas korzystających z usług operatora B). Operator A spodziewa się, że kampania ta wywoła odzew ze strony operatora zasiedziałego i to jeszcze zanim zdążą sfinalizować zasady korzystania z usługi LLU. Operator A zakłada możliwość promowania jednego z trzech wariantów oferty detalicznej: a1 , a2 lub a3 . Spodziewa się, iż w odpowiedzi operator B wdrożyć może jeden z trzech planów taryfowych: b1 , b2 lub b3 . Na bazie oceny własnej infrastruktury sieciowej oraz możliwych punktów styku (kolokacji) z siecią operatora B, operator A dopuszcza dwa sposoby korzystania z uwolnionej pętli lokalnej (ULL) operatora A: h2 i h3 . Z racji na fakt, iż operator B zobowiązany jest przedstawienia oferty ramowej w sprawie LLU, co jak pokazała dotychczasowa praktyka staje się podstawą do stworzenia rekomendowanych przez regulatora zasad wzajemnej współpracy w przypadku braku porozumiemia, operator A uwzględnia też możliwość, iż wynikiem (zerwanych) negocjacji będzie przyjęcie zasad określonych w tej ofercie: h1 . Na podstawie opracowanego przez Państwowy Instytut Badawczy powszechnie dostępnego modelu popytu na usługi telekomunikacyjne obaj operatorzy określili szacunkową liczbę pozyskanych (utraconych) abonentów w rezultacie wdrożenia poszczególnych ofert detalicznych (swojej i konkurenta), a następnie oszacowali wielkość rocznych przychodów czerpanych z oferowanych im usług. Wartości przychodów (w milionach złotych) dla poszczególnych wariantów ofert detalicznych oraz wariantów porozumienia w sprawie LLU zilustrowano w tabeli 2.13. Presja ze strony rosnącej konkurencji sprawia, iż obaj gracze dążą do osiągnięcia jak najlepszych wyników finansowych ze swego punktu widzenia, a przy tym w miarę możliwości do pogorszenia wyników konkurentów (cel minimalnie antagonistyczny). Problem sprowadza się do pytania: który z wariantów oferty detalicznej gracz A powinien wybrać? Tabela 2.13: Gra podwójna na rynku lokalnym. a1 a2 h1 h2 h3 b1 [2, 3] [3, 1] [1, 4] b2 [2, 2] [5, 3] b3 [3, 2] [3, 4] a3 h1 h2 h3 h1 h2 h3 b1 [1, 2] [2, 3] [3, 2] b1 [2, 5] [3, 4] [4, 3] [3, 5] b2 [5, 2] [4, 3] [4, 4] b2 [1, 1] [2, 5] [2, 5] [4, 2] b3 [2, 3] [3, 2] [2, 3] b3 [3, 3] [3, 2] [2, 3] Opisany wyżej problem to w istocie przykład gry podwójnej, w którym ustalona została kolejność ruchów w kolejności ABH. Ponadto obaj gracze znają nawzajem swój sposób roze- 32 ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY POJEDYNCZEJ PRZEZ GRACZA B grania gry (cel minimalnie antagonistyczny). Znają też nawzajem swoje macierze wypłat. Do rozwiązania tego problemu zastosujemy omówioną uprzednio metodę. 1. Określenie dla każdej z gier ai zbioru możliwych wyników negocjacji (wybranych strategii hl oraz odpowiadających im decycji na rynku detalicznym gracza B (bj ) oraz odpowiadających im A , V B ]. par wypłat [Vijl ijl W pierszej kolejności próbujemy ustalić, jakie są potencjalnie możliwe wyniki każdej z gier pojedynczych ai . Przedyskutujmy zatem poszczególne gry w celu odrzucenia tych strategii, które nie powinny zostać wybrane. Analiza gry a1 Macierz wypłat w grze pojedynczej a1 przedstawia się jak w tabeli 2.14. Rozważmy możliwe sposoby rozegrania tej gry. Tabela 2.14: Macierz wypłat z gry pojedynczej a1 . h1 h2 h3 b1 [2, 3] [3, 1] [1, 4] b2 [2, 2] [5, 3] [3, 5] b3 [3, 2] [3, 4] [4, 2] W sytuacji gdy gracz B wybrałby strategię b1 , wówczas teoretycznie możliwe sa trzy wyniki: [2, 3], [3, 1] i [1, 4]. W praktyce jednak, z racji na fakt, iż strategia h1 jest strategią rekomendowaną przez regulatora, on w rzeczywistości byłaby wynikiem negocjacji. Na wybór strategii h2 nie zgodzi się gracz B, bowiem wówczas otrzymał by wypłatę (1) mniejszą, aniżeli w przypadku strategii rekomendowanej (3). Z tych samych względów na wybór strategii h3 nie zgodziłby się gracz A. W przypadku wyboru strategii b1 możliwy jest więc jedynie wynik [2, 3] odpowiadający wyborowi na rynku hurtowym strategii h1 . Ciekawa sytuacja zachodzi w przypadku, gdyby gracz B wybrał strategię b2 . Wynik [2, 2] odpowiadający strategii rekomendowanej h1 jest wynikiem gorszym dla obu graczy aniżeli wyniki odpowiadające strategiom h2 i h3 . W tym przypadku jednak obaj gracze dążyli będą w negocjacjach do wyboru innej strategii. Gracz A dążył będzie do wyboru strategii h2 , co da [5, 3], gracz B natomiast do wyboru strategii h3 , co da wynik [3, 5]. Sytuacja wydaje się trudna i nieposiadająca efektywnego rozwiązania kompromisowego. Nie można więc wykluczyć, iż gracze nie zawrą 2.2. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES USTALANIA CEN NA RYNKU DETALICZNYM GRACZA A 33 porozumienia i negocjacje zostaną zerwane, co w efekcie da im wynik nieefektyny [2, 2]. W tej sytuacji należy się liczyć, iż wynikiem negocjacji może być każda ze strategii hl . W sytuacji wyboru przez gracza B strategii b3 , wynik odpowiadający rekomendowanej przez regulatora strategii h1 również nie jest rozwiązaniem efektywnym. Jednakże na wyborze innej strategii skorzystać może tylko jeden z graczy. Wybór strategii h2 przynosi korzyść jedynie graczowi B, wybór strategii h3 – jedynie graczowi A. W tej sytuacji, z racji na fakt, iż gracze kierują się celem minimalnie antagonistycznym, dążąc w pierwszej kolejności do wyboru strategii najkorzytniejszej dla siebie, a w przypadku niejednoznaczności wyniku, to wyboru strategii dającej gorszą wypłatę drugiemu graczowi, jedynym akceptowalnym przez obie strony rozwiązaniem jest wybór strategii h1 , co da wynik [3, 2]. Z punktu widzenia problemu decyzyjnego gracza A w grze podwójnej, istotna jest odpowiedź na pytanie: którą ze strategii bj wybierze gracz B. Wymaga to porównania z punktu widzenia celu gracza B wyników, jakie mogą się ustalić w rezultacie wyboru poszczególnych strategii bj . Jeśli gracz B wybrałby strategię b1 ustali się wynik [2, 3]. Jeśli gracz B wybierze strategię b2 ustali się jeden z wyników: [2, 2], [5, 3] lub [3, 5]. Jeśli gracz B wybierze strategię b3 ustali się wynik [3, 2]. Z powyższego zestawienia pewnym jest, iż gracz B nie wybierze strategii b3 , bowiem to dałoby mu wypłatę gorszą (równą 2), niż w przypadku wyboru strategii b1 (równą 3). Można również założyć, iż motywacją wyboru strategii b2 nie będzie z pewnością nadzieja uzyskania wyniku [5, 3], bowiem minimalnie antagonistyczne nastawienie gracza B sugerowałoby mu raczej wybór strategii b1 , co bez straty dla niego da gorszą wypłatę graczowi A. Wybór strategii b2 motywowany może więc być jedynie nadzieją na osiągnięcie wyniku [3, 5]. W trakcie rozgrywania gry pojedynczej, gracz B może wykorzystać tę sytuację, stawiając warunek graczowi A, iż wybierze strategię b2 tylko pod warunkiem, że gracz A zgodzi się na wybór strategii h3 . Z punktu widzenia dopiero co zakończonej (wyborem strategii a1 ) gry podwójnej, gracz A sam może taką propozycję złożyć, iż zgodzi się na wybór strategii h3 jeśli tylko gracz B wybierze strategię b2 . Jeśli taka propozycja zostanie złożona, to gracz A może przyjąć, iż gracz B wybierze w grze a1 strategię b2 . Jaki będzie wówczas wynik? Jeśli przyjęta propozycja będzie wiarygodna, wynikiem będzie [3, 5]. Jednakże gdy już dojdzie do negocjacji warunków umowy hurtowej H, czyli już po wyborze strategii a1 i b2 na swój sposób „gra” zacząć się może od nowa. Stawiając na szali własną reputację, jako wiarygodnego gracza, A może zacząć zabiegać o uzyskanie wyniku [5, 3]. Wybór strategii b2 zależny jest więc od tego, na ile gracz B postrzega gracza A, jako wiarygodnego. Przed potencjalnym niedotrzymaniem słowa przez gracza A, gracz B może się zabezpieczyć czyniąc proces ustalania cen detalicznych bj elementem procesu negocjacji H, czyli w istocie przekształcając przypadek ABH, w przypadek A(BH) [9]. 34 ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY POJEDYNCZEJ PRZEZ GRACZA B Możliwym jest jednakże również wybór strategii b2 mimo braku złożonych uprzednio deklaracji przez gracza A, jak również braku postawionych przez gracza B wstępnych warunków. Gracz B może po prostu ryzykować wybór strategii b2 w nadzieji, że uda mu się wynegocjować zasady określone przez h3 (co jest zgodne z minimalnie antagonistycznym celem do jakiego dąży), a w najgorszym razie może się zgodzić na strategię h2 , która co prawda względem strategii b1 nie będzie zbyt dobrze odzwierciedlać celu (minimalnie) antagonistycznego, ale przynajmniej nie przyniesie mu straty. Wobec powyższych rozważań gracz A nie może mieć pewności, który z wyników w ostateczności się ustali. Rozsądnym jest więc założenie, iż gra a1 zakończyć się może jednym z czterech wyników: [2, 3], [2, 2], [5, 3] lub [3, 5]. Analiza gry a2 Macierz wypłat w grze pojedynczej a2 przedstawia się jak w tabeli 2.15. Rozważmy możliwe sposoby rozegrania tej gry. Tabela 2.15: Macierz wypłat z gry pojedynczej a2 . h1 h2 h3 b1 [1, 2] [2, 3] [3, 2] b2 [5, 2] [4, 3] [4, 4] b3 [2, 3] [3, 2] [2, 3] W sytuacji, gdy gracz B wybierze strategię b1 , w ramach negocjacji H gracz A dążył będzie do wyboru strategii h3 , natomiast gracz B do wyboru strategii h2 . Warto zauważyć, iż strategia rekomendowana przez regulatora h1 jest w sensie celu (minimalnie antagonistycznego) do jakiego dążą gracze strategią zdominowaną jedynie przez strategię h2 , kiedy to obaj gracze uzyskują rozwiązanie lepsze [2, 3]. Strategia h3 dominuje strategię h1 jedynie z punktu widzenia gracza A, uzyskuje on bowiem poprawę swego wyniku, bez pogorszenia wypłaty gracza B. Z punktu widzenia gracza B zachodzi jednak już dominacja odwrotna. Gracz B bowiem oprócz maksymalizacji własnej wypłaty zainteresowany jest również minimalizacją wypłaty gracza A, a więc wynik [1, 2] jest dla niego bardziej pożądany. Oczywistym jest więc, iż strategia h3 nigdy nie zostanie wybrana – nie zgodzi się na to gracz B. Ciekawą kwestią jest tutaj sposób argumentowania, jaki w trakcie negocjacji H gracz B mógłby wysuwać. Wcale nie musiałby otwarcie mówić, że dąży do pogorszenia wypłaty gracza 2.2. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES USTALANIA CEN NA RYNKU DETALICZNYM GRACZA A 35 A. Wystarczyłoby, że odwołałby się do wyniku [2, 3] zarzucając niezgadzającemu się na jego przyjęcie graczowi A brak dobrej woli (w istocie, traktując wynik [1, 2] jako swoiste status qou, wynik [2, 3] – jako równomiernie poprawiający sytuację obu graczy – jawi się jako rozwiązanie bardziej uczciwe). Słusznie więc można się spodziewać, iż jeśli tylko gracze utrzymają swe minimalnie antagonistyczne nastawienie rezultatem gry będzie [2, 3]. W sytuacji wyboru strategii b2 oczywistym wynikiem negocjacji będzie [5, 2], odpowiadający wyborowi przez gracza A strategii h1 , rekomendowanej przez regulatora. Podobnie w przypadku wyboru strategii b3 wynikiem będzie [2, 3], który ustali się albo w rezultacie wyboru strategii h1 albo h3 . Na podstawie powyższych analiz można się spodziewać, iż gracz B wybierze strategię b3 , co doprowadzi do wyniku [2, 3]. Jest to rozwiązanie nieefektywne. Lepsze wyniki obaj gracze uzyskali by wówczas, gdyby gracz B wybrał strategię b2 , a wynikiem negocjacji byłaby strategia h3 . Gracz B jednakże słusznie się obawia, iż w przypadku, gdyby wybrał strategię b2 gracz A zerwie negocjacje i w rezultacie ustali się wynik [5, 2] określony przez strategię h1 . Widać zatem, iż korzystnym byłoby tu dla obu graczy, gdyby gracz A złożył obietnicę, iż w przypadku, gdy gracz B wybierze strategię b2 , zgodzi się na wybór strategii h3 . A zatem wynik gry a2 zależny jest od postawy gracza A, oraz postrzeganej przez gracza B wiarygodności jego obietnicy. Jeśli gracz A złoży wiarygodną obietnicę wyboru strategii h3 (np. obniżając wartość własnej wypłaty dla strategii h1 z 5 do 3), może się spodziewać wyniku [4, 4]. Jeśli takiej obietnicy nie złoży, lub gracz B w nią nie uwierzy wynikiem będzie [2, 3]. Analiza gry a3 Macierz wypłat w grze pojedynczej a3 przedstawia się jak w tabeli 2.16. Rozważmy możliwe sposoby rozegrania tej gry. Tabela 2.16: Macierz wypłat z gry pojedynczej a3 . h1 h2 h3 b1 [5, 2] [3, 4] [4, 4] b2 [1, 1] [2, 5] [2, 5] b3 [3, 3] [3, 2] [2, 3] W sytuacji, gdy gracz B wybierze strategię b1 , wynikiem negocjacji będzie strategia rekomendowana [h1 ] (co jest w interesie gracza A), w rezultacie czego ustali się wynik [5, 2]. 36 ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY POJEDYNCZEJ PRZEZ GRACZA B W sytuacji wyboru strategii b2 , minimalnie antagonistyczne podejście gracza A będzie przyczyną zgody na wybór strategii h2 lub h3 , co da wynik [2, 5]. Ciekawa sytuacja zachodzi w przypadku wyboru strategii b3 . Tu, z racji na (minimalnie) antagonistyczny cel obu graczy, obaj będą dążyli do wyboru innej strategii: gracz A do wyboru strategii h2 , co dało by wynik [3, 2] gracz B zaś do wyboru strategii h3 , co dałoby wynik [2, 3] Rzecz jasna nie są to wyniki efektywne13 . Względem każdego z nich, jeden z graczy korzysta na wyborze strategii h1 . A zatem nie można się spodziewać innego wyniku, jak [3, 3]. W rezultacie można się spodziewać, iż w grze a3 gracz B wybierze strategię b2 , co doprowadzi do wyniku [2, 5]. Wynik ten jest efektywny, ale z całą pewnością nie zadowoli gracza A. Czy w jakiś sposób gracz ten może wpłynąć na poprawę swego wyniku? Odpowiedź jest pozytywna. Gracz A może wysunąć groźbę wobec gracza B, iż w przypadku, gdy ten wybierze strategię b2 on zerwie negocjacje, ustalając strategię h1 , co da wynik [1, 1], nieznacznie gorszy dla gracza A i znacząco dla gracza B. Jaką alternatywę ma gracz B w przypadku, gdy uzna groźbę za wiarygodną? Korzystnie będzie dla niego wybrać strategię b3 , co doprowadzi do wyniku [3, 3]. Nie jest to jednakże wynik efektywny. Obaj gracze skorzystaliby wówczas, gdyby gracz B wybrał strategię b1 , a rezultatem negocjacji byłaby strategia h3 , co dałoby wynik [4, 4]. Słusznie jednakże gracz B może się obawiać, że w przypadku gdyby wybrał strategię b1 , gracz A zerwie negocjacje, ustalając w ten sposób strategię h1 , co dałoby wynik [5, 2]. Widać więc, iż korzystnie dla gracza A może być nie tylko wysunięcie groźby zerwania negocjacji w przypadku wyboru strategii b2 , ale również złożenie obietnicy, iż w przypadku, gdy gracz B wybierze strategię b1 , zgodzi się na wybór strategii h3 . Gracz A może się więc spodziewać wyniku: • [2, 5] jeśli nie wysunie groźby wyboru strategii h1 gdy ustalona zostanie strategia b2 ; • [2, 5] lub [1, 1], jeśli gracz B nie uzna za wiarygodną jego groźby ([1, 1] jeśli groźbę spełni i [2, 5] gdy jej wykonania zaniecha); • [3, 3] jeśli wysunie wiarygodną groźbę, bez obietnicy, lub z obietnicą, której gracz B nie uzna za wiarygodną. • [4, 4] jeśli wysunie wiarygodną groźbę i obietnicę i ją dotrzyma. • [5, 2] jeśli nie dotrzyma obietnicy (połączonej z groźbą), w którą gracz B uwierzy. A , V B ], 2. Stworzenie skalarnej miary oceny (VilA ) poszczególnych wyników gry [Vijl ijl odpowiadającej celowi, do jakiego dążył będzie gracz A (indywidualnie efektywny lub 13 Do takich (nieefektywnych) wyników prowadzą strategie antagonistyczne. 2.2. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES USTALANIA CEN NA RYNKU DETALICZNYM GRACZA A 37 antagonistyczny) i przypisanie poszczególnym wynikom ich wartości wyznaczonej przez tą miarę. Gracz A rozgrywa grę w sposób minimalnie antagonistyczny. Zatem do oceny poszczególnych wartości wypłat przyjmie następujące kryterium skalaryzujące: V A [V A , V B ] = wA · V A − wB · V B . (2.29) Dla spełnienia warunku wA wB , przyjmiemy wA = 100, wB = 1. Zgodnie z analizami przeprowadzonymi uprzednio wyniki rozegrania poszczególnych gier pojedynczych mogą być następujące: • w grze a1 : [2, 3], [2, 2], [5, 3] lub [3, 5]; • w grze a2 : [4, 4] lub [2, 3] – zakładamy tu, iż gracz A wysunie wobec gracza B obietnicę wyboru strategii h3 w przypadku, gdy zostanie wybrana strategia b2 , co może doprowadzić do wyniku [4, 4]. W momencie rozgrywania gry podwójnej (ustalania ceny na rynku detalicznym A gracz A jednakże nie może mieć pewności, iż gracz B obietnicę przyjmie, stąd możliwy wynik [2, 3]. • w grze a3 : [2, 5], [3, 3] lub [5, 2] – zakładamy tu, iż gracz A wysuwa wobec gracz B groźbę zerwania negocjacji (wyboru strategii rekomendowanej h1 ) w przypadku, gdy gracz B wybierze strategię b2 oraz obietnicę zgody na strategię h3 , w przypadku wyboru strategii b1 . Gracz A nie zamierza jednakże dotrzymać ani groźby, ani obietnicy. Jeśli gracz B nie uwierzy ani w groźbę gracza A ustali się wynik [2, 5]. Jeśli uwierzy w groźbę, ale nie uwierzy w obietnicę, ustali się wynik [3, 3]. Jeśli uwierzy i w groźbę i w obietnicę - ustali się wynik [5, 2]. Poszczególnym wynikom odpowiadają więc następujące wartości skalarne: • w grze a1 : V A [2, 3] = 100 · 2 − 1 · 3 = 197. V A [2, 2] = 100 · 2 − 1 · 2 = 198. V A [5, 3] = 100 · 5 − 1 · 3 = 497. V A [3, 5] = 100 · 3 − 1 · 5 = 295. • w grze a2 : V A [4, 4] = 100 · 4 − 1 · 4 = 396. V A [2, 3] = 100 · 2 − 1 · 3 = 197. 38 ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY POJEDYNCZEJ PRZEZ GRACZA B • w grze a1 : V A [2, 5] = 100 · 2 − 1 · 5 = 195. V A [3, 3] = 100 · 3 − 1 · 3 = 297. V A [5, 2] = 100 · 5 − 1 · 2 = 498. Poszczególne gry opisać więc można następującymi wektorami wartości skalarnych, odpowiadających wartościom potencjalnie możliwym do uzyskania w tych grach wynikom: – gra a1 – wektor [197, 198, 497, 295]; – gra a2 – wektor [396, 197]; – gra a3 – wektor [195, 297, 498]. 3. Określenie pożądanego sposobu agregacji (agregacja względem strategii hl ) poszczególnych wartości skalarnych Υ(VilA ) i wybór określonej strategii ai dla której agregat przyjmuje wartość największą. Ostateczna ocena danej strategii ai zależna jest od sposobu agragacji, jaki gracz A przyjmie w celu porównania wektórów wartości skalarnych opisujących możliwe wyniki każdej z gier. Jeśli gracz A kierował się będzie agregacją Walda postaci: Υi = min VilA , l wówczas dla poszczególnych gier otrzymamy: • w grze a1 – Υ1 = min(197, 198, 497, 295) = 197; • w grze a2 – Υ2 = min(396, 197) = 197; • w grze a3 – Υ3 = min(195, 297, 498) = 195. Jeśli gracz A kierował się będzie agregacją optymistyczną postaci: Υi = max VilA l wówczas dla poszczególnych gier otrzymamy: • w grze a1 – Υ1 = max(197, 198, 497, 295) = 497; • w grze a2 – Υ2 = max(396, 197) = 396; • w grze a3 – Υ3 = max(195, 297, 498) = 498. 2.2. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES USTALANIA CEN NA RYNKU DETALICZNYM GRACZA A 39 Jeśli gracz A kierował się będzie agregacją Laplace’a postaci: Υi (VilA ) = 1X A V . L l il wówczas dla poszczególnych gier otrzymamy: • w grze a1 – Υ1 = 14 (197 + 198 + 497 + 295) = 296, 75; • w grze a2 – Υ2 = 12 (396 + 197) = 296, 5; • w grze a3 – Υ3 = 13 (195 + 297 + 498) = 330. Niezależnie od sposobu agregacji gracz A winien wybrać taką strategię ak , która da mu największą wartość agregatu Υk : ak = arg max Υi . i Zatem w przypadku wyboru agregacji Walda gracz A winien wybrać strategię a1 lub a2 . Natomiast przyjmując agregację optymistyczną lub Laplace’a – strategię a3 . Wybór określonej strategii winien być jednakże poparty głębszą analizą. Dla przykładu, w przypadku wyboru agregacji optymistycznej maksymalna wartość skalarna dla gry a3 jest minimalnie lepsza (równa 498) od wartości z gry a1 (równa 497). Przeprowadzona analiza szacuje jedynie wartości liczbowe, odzwierciedlające poszczególne wyniki gry. Liczby te jednakże nie uwzględniają zysków i strat innej natury. Jak pamiętamy, w grze a3 wartość najlepszą 498 gracz A uzyskać może jedynie wówczas, gdy uprzednio wysunie wobec gracza B groźbę, a ponadto złoży obietnicę, której nie dotrzyma. Liczba 498 nie uwzględnia więc ani kosztów poniesionych na reputacji gracza B, ani też jego kosztów moralnych. Wartość 497, odpowiadająca najlepszemu wynikowi z gry a1 , choć zapewne nie jest prostszą od poprzedniej do uzyskania, to jednakże pozostawia lepszym obraz gracza A tak zarówno w jego własnych, jak też konkurenta oczach. 40 ROZDZIAŁ 2. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A ZNA SPOSÓB ROZEGRANIA GRY POJEDYNCZEJ PRZEZ GRACZA B Rozdział 3 Ustalona kolejność ruchów – gracz A nie zna sposóbu rozegrania gry pojedynczej przez gracza B W dalszym ciągu rozważamy przypadek, gdy w grze podwójnej gracz A wykonuje ruch jako pierwszy (czy to w sensie ustalenia cen na rynku detalicznym A, czy w sensie negocjowania cen na rynku hurtowym H). Tym razem zakładamy, iż gracz A nie zna sposóbu rozegrania gry pojedynczej przez gracza B, a więc nie wie, czy gracz B dążył będzie do celu indywidualnie efektywnego, czy też do celu antagonistycznego. Na wstępie należy stwierdzić, iż jest to przypadek bardziej prawdopodobny. W szczególności będzie tak wówczas, gdy pierwszym ruchem w grze podwójnej będzie proces ustalania cen detalicznych przez gracza A. W przypadku, gdy pierwszym ruchem byłby proces negocjacji H, gracz A mógłby uzyskać pewne informacje o sposobie rozegrania gry pojedynczej na podstawie sposobu negocjowania gracza B (pierwszy ruch w grze podwójnej). I tu jednakże należałoby wziąć poprawkę na fakt, iż zespół negocjatorów operatora B mógłby mieć niewielki wpływ na decyzje cenowe podejmowane na rynku detalicznym (B), jak też na fakt, iż sposób negocjowania mógłby być elementem swoistej manipulacji percepcją gracza A, w kwestii dalszego sposobu rozgrywania gry przez gracza B. A zatem w wielu przypadkach założenie o nieznajomości przez gracza A, w trakcie rozgrywania gry podwójnej, sposobu rozegrania gry pojedynczej przez gracza B, będzie założeniem poprawnym. Podobnie jak poprzednio problem rozpatrzymy w dwóch osobnych przypadkach: • Pierwszym ruchem w grze podwójnej jest proces negocjacji stawek rozliczeniowych na rynku hurtowym – H 41 ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 42 POJEDYNCZEJ PRZEZ GRACZA B • Pierwszym ruchem w grze podwójnej jest proces ustalania cen na rynku detalicznym gracza A 3.1 Pierwszym ruchem w grze podwójnej jest proces negocjacji stawek rozliczeniowych na rynku hurtowym – H W przypadku, gdy w grze podwójnej pierwszym ruchem jest proces negocjacji stawek rozliczeniowych na rynku hurtowym – H, w grze pojedynczej możliwe są dwa przypadki kolejności ruchów: AB i BA. Rozważymy każdy z nich osobno. 3.1.1 W grze pojedynczej pierwszy rusza się gracz A: przypadek HAB By rozstrzygnąć dylemat, w jaki sposób rozegrać grę podwójną, o jaką ze strategii hl w trakcie negocjacji zabiegać, gracz A musi rozstrzygnąć w jaki sposób rozegra, którą ze strategii ai wybierze w poszczególnych grach pojedynczych hl oraz przewidzieć i oszacować skutki, jakie za sobą pociągnie określona, jednakże a priori nie znana graczowi A odpowiedź gracza B. Stojąc przed koniecznością ruszania się jako pierwszy w grze pojedynczej, gracz A ma ograniczone możliwości stosowania strategii antagonistycznych. Skutek ich stosowania byłby na dodatek trudny do przewidzenia w kontekście nieznanego sposobu rozegrania gry przez gracza B. W szczególności gracz A musi się liczyć z tym, iż określoną, antagonistyczną strategię gracza A gracz B może odebrać jako prowokację, co doprowadzić może do takiej odpowiedzi, która da graczowi A wynik znacząco różny od tego, który chciałby otrzymać. Do rozwiązania problemu decyzyjnego gracza A zastosować można następującą metodę: Metoda: Wybór strategii gry w grze podwójnej HAB z założeniem, że gracz A nie zna celu do jakiego dąży gracz B 1. Określenie dla każdej strategii ai z poszczególnych gier pojedynczych, potencjalnie możliA , V B ]. wych odpowiedzi gracza B (strategii bj ) i odpowiadających im wyników [Vijl ijl A ) poszczególnych wyników gry [V A , V B ], odpowiada2. Stworzenie skalarnej miary oceny (Vijl ijl ijl jącej celowi, do jakiego dążył będzie gracz A (indywidualnie efektywny lub antagonistyczny) i przypisanie poszczególnym wynikom ich wartości wyznaczonej przez tą miarę. 3. Określenie pożądanego sposobu agregacji (agregacja względem strategii bj ) poszczególnych wartości skalarnych Υ(VilA ) i wskazanie strategii ai , dla której agregat przyjmuje wartość największą, jako strategia, którą gracz A powinien w danej grze pojedynczej hl wybrać. 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 43 Wartość agregatu Υ(VilA ) odpowiadająca wybranej strategii ai określa wartość danej gry pojedynczej dla gracza A. 4. W trakcie negocjacji H gracz A winien zabiegać o wybór tej strategii hl , której odpowiada gra pojedyncza hl o największej wartości (agregatu Υ(VlA )). Użyteczność powyższej metody zostanie omówiona na przykładzie. Przykład 3.1 Operator wirtualnej sieci komórkowej (MVNO) A rozpoczyna negocjacje dotyczące możliwości korzystania z infrastruktury operatora operatora sieci komórkowej B. W zależności od kształtu wynegocjowanej umowy operator A rozważa trzy możliwe oferty usługowe dla własnych użytkowników końcowych: a1 , a2 i a3 . Dopuszcza, że gracz B nie pozostanie bierny na tę sytuację i wprowadzi na własny rynek detaliczny jedną z trzech ofert: b1 , b2 lub b3 (przypadek HAB). Oferta b1 jest najbardziej stonowaną, zbliżoną do oferty a1 , która zdaniem analityków operatora A doprowadzi do względnego zrównoważenia sił obu graczy na rynku. Szacuje się, iż wdrożenie oferty b3 może znaczącą osłabić pozycję operatora A na rynku, jednakże nie bez szkody finansowej dla gracza B. Celem gracza A jest jak najszybsze pozyskanie możliwie dużego udziału w rynku (gra o udział w rynku). Gracz B zasadniczo skupiony jest na maksymalizacji zysku (gra o zysk). Gracz A dopuszcza jednak, iż uwaga gracza B może jednak zostać skupiona na maksymalizacji zysku w dłuższej perspektywie, co w praktyce może oznaczać chęć ograniczenia udziału w rynku gracza A, nawet kosztem tymczasowych strat finansowych. Gracz A nie ma jednak pewności, czy na taki sposób rozegrania gry gracz B się zdecyduje. W ramach negocjacji dotyczących możliwości korzystania z infrastruktury operatora B operator A rozważa albo zabieganie o zawarcie umowy określonej na zasadach wyrażonych w strategii h1 albo przyjęcie rozwiązania rekomendowanego przez regulatora rynku (strategia h2 ). Macierz wypłat graczy przedstawia się jak w tabeli 3.1. Problem decyzyjny gracza A sprowadza się do pytania o wybór której ze strategii hl w trakcie prowadzonych w ramach gry podwójnej negocjacji winien zabiegać. W celu rozwiązania tego problemu prześledzimy kolejne kroki przedstawionej wyżej metody. 1. Określenie dla każdej strategii ai z poszczególnych gier pojedynczych, potencjalnie możliwych A , V B ]. odpowiedzi gracza B (strategii bj ) i odpowiadających im wyników [Vijl ijl Rozważmy każdą z gier pojedynczych hl osobno. ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 44 POJEDYNCZEJ PRZEZ GRACZA B Tabela 3.1: Macierz wypłat w grze z ustaloną kolejnością HAB, w której gracz A nie zna sposobu rozegrania gry przez gracza B. h1 h2 b1 b2 b3 b1 b2 b3 a1 [5,5] [3,4] [1,3] a1 [4,4] [4,3] [2,3] a2 [4,3] [3,4] [3,2] a2 [3,2] [2,3] [1,1] a3 [3,2] [3,3] [2,1] a3 [3,1] [2,2] [3,4] Analiza gry h1 • Gracz A wybiera strategię a1 Jeśli gracz B odpowie strategią efektywną b1 wówczas usali się wynik [5, 5]. Jeśli gracz B odpowie strategią maksymalnie antagonistyczną b3 wówczas ustali się wynik [1, 3]. Jeśli gracz B odpowie w sposób umiarkowanie antagonistyczny wówczas ustali się wynik [3, 4]. Z punktu widzenia gracza A rozsądnie jest tu zatem przyjąć, iż gracz B wybrać może każdą spośród dostęnych tu strategii. • Gracz A wybiera strategię a2 Jeśli gracz B odpowie w sposób indywidualnie efektywny, wybierając strategię b2 , wówczas ustali się wynik [3, 4]. Jest to w tym przypadku praktycznie jedyna odpowiedź, której gracz A może się ze strony gracza B spodziewać. Nie wydaje się bowiem zbyt prawdopodobnym, by gracz B ze stratą dla siebie wybrał strategię b1 , co poprawiłoby na dodatek wypłatę gracza A (wynik [4, 3]), lub strategię b3 , która bez zmiany wartości wypłaty gracza A pogorszyłaby wypłatę gracza B (wynik [3, 2]). W przypadku wyboru strategii a2 gracz A może być zatem pewien wyniku [3, 4], a jeśliby jednak wynik miałby być inny, to będzie to dla niego jedynie miłą niespodzianką. • Gracz A wybiera strategię a3 Jeśli gracz A wybierze strategię a3 , odpowiedzią gracza B z pewnością nie będzie strategia b1 , ta bowiem dałaby graczowi B wypłatę gorszą, niż w przypadku wyboru strategii b2 , bez zmiany wartości wypłaty gracza A. Ostatecznie gracz B odpowiedzieć więc może 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 45 albo efektywną strategią b2 , co doprowadzi do wyniku [3, 3] albo antagonistyczną b3 , co doprowadzi do wyniku [2, 1]. Analiza gry h2 • Gracz A wybiera strategię a1 Jeśli gracz A wybierze strategię a1 , gracz B z pewnością nie odpowie strategią b2 . Korzystniej byłoby dla gracza B, a bez różnicy z punktu widzenia wypłaty gracza A byłoby wybrać strategię b1 , co doprowadziłoby do efektywnego wyniku [4, 4]. Gracz B odpowiedzieć jeszcze może antagonistyczną strategią b3 , co doprowadziłoby do wyniku [2, 3]. • Gracz A wybiera strategię a2 W przypadku wyboru przez gracza A strategii a2 , gracz B odpowie strategią b2 lub b3 . W ten sposób ustali się wynik [2, 3] lub [1, 1]. Strategii b1 gracz B nie powinien wybrać, bowiem przyniosłoby to mu wynik gorszy niż w przypadku strategii b2 , a przy tym poprawiłoby wynik gracza A. • Gracz A wybiera strategię a3 Jeśli gracz A wybierze strategię a3 , może się spodziewać, iż odpowiedzią gracza B będzie albo strategia b2 , co dałoby wynik [2, 2], albo strategia b3 , co da wynik [3, 4]. Strategia b1 względem strategii b3 nie zmieniłaby wartości wypłaty gracza A pogorszając wypłatę gracza B. Podsumowując powyższe zestawienia gracz A może się spodziewać następujących wyników: • [5, 5], [3, 4] lub [1, 3] dla h1 i a1 ; • [3, 4] dla h1 i a2 ; • [3, 3] lub [2, 1] dla h1 i a3 ; • [4, 4] lub [2, 3] dla h2 i a1 ; • [2, 3] lub [1, 1] dla h2 i a2 ; • [2, 2] lub [3, 4] dla h2 i a3 ; ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 46 POJEDYNCZEJ PRZEZ GRACZA B A ) poszczególnych wyników gry [V A , V B ], 2. Stworzenie skalarnej miary oceny (Vijl ijl ijl odpowiadającej celowi, do jakiego dążył będzie gracz A (indywidualnie efektywny lub antagonistyczny) i przypisanie poszczególnym wynikom ich wartości wyznaczonej przez tą miarę. Zanim ustalimy cel, do jakiego w rozpatrywanej grze dążył będzie gracz A warto w tym miejscu rozważyć, jak sposób rozegrania gry przez gracza A może wpłynąć na sposób rozegrania gry przez gracza B. Rozważmy dla przykładu następujące rozumowanie. Załóżmy, iż gracz A przypuszcza, że gracz B dążył będzie do celu indywidualnie efektywnego. Gracz A zastanawia się nad wyborem jednego z dwóch scenariuszy: h1 i a3 lub h2 i a2 . Jeśli gracz A dążył będzie do celu minimalnie antagonistycznego, wówczas powinien wybrać scenariusz h2 i a2 (przy założeniu, że tylko te dwa sceneriusze są dostępne). Przy tym scenariuszu wynikiem będzie [2, 3] jeśli gracz B odpowie indywidualnie efektywną strategią b2 , lub [1, 1] jeśli gracz B odpowie w sposób antagonistyczny wybierając strategię b3 . Niezależnie od sposobu rozegrania gry przez gracza B, bez straty dla gracza A da to wynik gorszy dla gracza B, niżby to było w przypadku scenariusza h1 i a3 , kiedy to dostępnymi wynikami byłyby [3, 3] lub [2, 1]. Owo pogorszenie wyniku gracza B jest zgodne z antagonistycznym nastawieniem gracza A. Możliwym jednak jest, iż cel do jakiego dążył będzie gracz B zależny będzie od scenariusza, jaki wybierze gracz A. Dla przykładu, jeśli gracz A wybierze scenariusz h1 i a3 , gracz B może być skłonny zagrać w sposób indywidualnie efektywny, wybierając strategię b2 i ustalając w ten sposób wynik [3, 3]. Jednakże wybór scenariusza h2 i a2 gracz B potraktować może (i słusznie) jako antagonistyczne podejście do gry ze strony gracza A i w efekcie odpowiedzieć również w sposób antagonistyczny, wybierając strategię b3 i doprowadzając do wyniku [1, 1]. Jednym słowem jawny antagonizm (choćby i minimalny) ze strony gracza A sprowokować może antagonizm po stronie gracza B, mimo pierwotnego założenia o rozegraniu gry w sposób indywidualnie efektywny. Wynik więc może być radykalnie różny od tego, do jakiego pierwotnie dążył gracz A, a dążenie do realizacji określonego celu (tu minimalnie antagonistycznego) prowadzić może do rozwiązania odbiegającego od tego celu w sposób daleki. O ile rozpatrywane w tym punkcie tworzenie skalarnej miary wyników gry, odpowiada celowi do jakiego dąży gracz A, o tyle cel do jakiego dąży gracz B ujęty zostanie w następnym punkcie, poprzez określenie odpowiedniego sposobu agregacji. Z powyższej analizy widać, iż właściwym podejściem może się okazać, tworzenie różnych sposobób agragacji dla różnych scenariuszy gry. Pozostając jednakże przy problemie tworzenia skalarnej miary oceny poszczególnych wyników gry warto w tym miejscu też zasygnalizować, że właściwym podejściem do tworzenia tej miary w przypadku, gdy gracz A dążył będzie do celu indywidualnie efektywnego, będzie uwzględnienie w tej mierze nie tylko wartości wypłaty gracza A, ale również wartości wypłaty gracza B. Co więcej, 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 47 w interesie gracza A winno być tej wypłaty maksymalizowanie. Takie podejście w maksymalny sposób sprzyjać będzie temu, by gracz B nie odpowiedział w sposób antagonistyczny. Załóżmy więc, że gracz A dąży do celu indywidualnie efektywnego, a skalarna miara oceny przyjmie następującą postać: V A [V A , V B ] = wA · V A + wB · V B , (3.1) przy czym wA = 100, wB = 1. Stąd dla poszczególnych scenariuszy gry i odpowiadających im możliwych wyników otrzymujemy: • Scenariusz h1 i a1 : V A [5, 5] = 100 · 5 + 1 · 5 = 505. V A [3, 4] = 100 · 3 + 1 · 4 = 304. V A [1, 3] = 100 · 1 + 1 · 3 = 103. • Scenariusz h1 i a2 : V A [3, 4] = 100 · 3 + 1 · 4 = 304. • Scenariusz h1 i a3 : V A [3, 3] = 100 · 3 + 1 · 3 = 303. V A [2, 1] = 100 · 2 + 1 · 1 = 201. • Scenariusz h2 i a1 : V A [4, 4] = 100 · 4 + 1 · 4 = 404. V A [2, 3] = 100 · 2 + 1 · 3 = 103. • Scenariusz h2 i a2 : V A [2, 3] = 100 · 2 + 1 · 3 = 203. V A [1, 1] = 100 · 1 + 1 · 1 = 101. • Scenariusz h2 i a3 : V A [2, 2] = 100 · 2 + 1 · 2 = 202. V A [3, 4] = 100 · 3 + 1 · 4 = 304. ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 48 POJEDYNCZEJ PRZEZ GRACZA B Przed przejściem do kolejnego kroku metody, gracza A może już w tym momencie wyeliminować te scenariusze gry, które w świetle celu, do którego dąży są zdominowane. Za zdominowane w sensie określonego celu gry uznaje się te scenariusze, dla których można znaleźć inny scenariusz, który ma: 1. tyle samo możliwych wyników gry, a odpowiadający tym wynikom wektor uporządkowanych (np. malejąco) wartości skalarnych dominuje wektor wartości odpowiadających scenariuszowi zdominowanemu; 2. mniej możliwych wyników gry, przy czym odpowiadający tym wynikom wektor uporządkowanych wartości skalarnych dominuje pod-wektor o tym samym wymiarze największych wartości skalarnych odpowiadających scenariuszowi zdominowanemu; 3. więcej możliwych wyników gry, przy czym odpowiadający tym wynikom pod-wektor najmniejszych wartości skalarnych o tym samym wymiarze co wektor odpowiadający scenariuszowi zdominowanemu, ów wektor dominuje. I tak dla przykładu scenariusz h2 i a3 , któremu odpowiadaja wektor wartości skalarnych [304, 202] dominuje (w sensie pierwszej z powyższych definicji dominacji) scenariusz h2 i a2 , któremu odpowiada wektor wartości skalarnych [203, 101], a także scenariusz h1 i a3 , któremu odpowiada wektor wartości skalarnych [303, 201]. A zatem scenariusze h2 i a2 oraz h1 i a3 , jako zdominowane można usunąć z dalszej analizy, bowiem nie jest w interesie gracza A dążenie do ich zrealizowania. Gracz A mógłby jednakże pozostawić do dalszej analizy scenariusz h1 i a3 z tego względu, iż choć jest od zdominowany przez scenariusz h2 i a3 , to jednak odpowiada wyborowi innej strategii na rynku hurtowym hl . Jeśli okazałoby się, że w trakcie negocjacji zostanie wybrana strategia h1 , wówczas scenariusz h1 i a3 jest w dalszym ciągu warto rozważenia. W omawianym jednak w tym miejscu przykładzie, kiedy to strategia h2 jest strategią rekomendowaną przez regulatora, gracz A może mieć pewność, że jeśli tylko uzna za stosowne dążyć do realizacji scenariusza h2 i a3 to uda mu się to uczynić. A zatem scenariusz h1 i a3 można usunąć z analizy. W sensie drugiej z powyższych definicji dominacji scenariusz h2 i a3 , któremu odpowiada wektor wartości skalarnych [304, 202] jest zdominowany przez scenariusz h1 i a2 , któremu odpowiada wektor [304]. Scenariusza h2 i a3 jednakże nie warto w tym miejscu usuwać z dalszej analizy, bowiem gracz A nie może mieć pewności, czy w przypadku chęci wybrania scenariusza h1 i a2 , uda mu się doprowadzić do tego, by w trakcie negocjacji wybrana została strategia h1 . W ten sposób przechodząc do następnego kroku metody gracz A rozważa poniższe scenariusze, wraz z odpowiadającymi im wektorami wartości skalarnych: 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 49 • Scenariusz h1 i a1 : wektor wartości skalarnych [505, 304, 103]. • Scenariusz h1 i a2 : wektor wartości skalarnych [304]. • Scenariusz h2 i a1 : wektor wartości skalarnych [404, 103]. • Scenariusz h2 i a3 : wektor wartości skalarnych [304, 202] 3. Określenie pożądanego sposobu agregacji (agregacja względem strategii bj ) poszczególnych wartości skalarnych Υ(VilA ) i wskazanie strategii ai , dla której agregat przyjmuje wartość największą, jako strategia, którą gracz A powinien w danej grze pojedynczej hl wybrać. Wartość agregatu Υ(VilA ) odpowiadająca wybranej strategii ai określa wartość danej gry pojedynczej dla gracza A. Trzeci krok ilustrowanej metody jest bez wątpienia krytyczny w całym procesie analizy sytuacji decyzyjnej gracza A. Nie znając celu do jakiego w ostatnim ruchu gry dążył będzie gracz B, gracz A musi zadecydować, jaką wartość mają dla niego poszczególne gry pojedyncze, spośród których będzie chciał jedną wybrać w trakcie przeprowadzanych w ramach gry podwójej negocjacji. Aby przypisane poszczególnym grom wartości, pozwalały uszeregować te gry w porządek zupełny [15, 21], co umożliwi graczowi A określenie najlepszej z nich, wartości te nie mogą być wektorami, ale skalarami. Gracz A musi więc dokonać agregacji poszczególnych wektorów wartości skalarnych odpowiadających poszczególnym scenariuszom gry. Rodzaj agregacji, jaki przyjmie gracz A odpowiada w istocie przypuszczeniu, do jakiego celu dążył będzie gracz B. Na tym polega krytyczność owego kroku. W najprostszym podejściu, gracz A może założyć całkowitą niepewność odnośnie celu, do jakiego dążył będzie gracz B i przyjąć odpowiadającą jego (A) stosunkowi do tej niepewności określoną formę agregacji: Walda, optymistyczną, Laplace’a, Hurwicza itp. Dla przykładu, jeśli gracz A charakteryzował się będzie maksymalną awersją do ryzyka, wówczas powinien przyjąć agregację Walda postaci: A Υ(VilA ) = min Vijl . j (3.2) Jeśli będzie neutralny względem ryzyka, wówczas największą wartość będzie miał dla niego ten scenariusz, dla którego wartość oczekiwana ze skalarnych miar oceny przyjmie wartość największą. W takiej sytuacji powinien przyjąć agregację Laplace’a postaci: Υ(VilA ) = 1X A V . J j ijl (3.3) ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 50 POJEDYNCZEJ PRZEZ GRACZA B Niezależnie od przyjętego sposobu agregacji, artość gry hl – Υ(VlA ) wyznacza się jako największa z wartości Υ(VilA ) dla ustalonej strategii hl , czyli zgodnie z zależnością: Υ(VlA ) = max VilA . (3.4) i Dla określenia wartości poszczególnych scenariuszy gry, a po przez to ostatecznie i wartości poszczególnych gier pojedynczych, gracz A może wykorzystać również zawarte w macierzy wypłat informacje, na tema opłacalności z punktu widzenia gracza B stosowania różnych strategii antagonistycznych. Na podstawie tych informacji gracz A może oszacować prawdopodobieństwo tego, że gracz B wybierze, lub nie wybierze danej strategii bj w ramach określonego scenariusza hl i ai . Do określenia wartości tego prawdopodobieństwa posłużyć może współczynik antagonistycznej zachęty do wyboru określonej bj [9]: B Υ̃ilj = n o n o , (3.5) VilBmax · max VilAmax − VjlA (ai ), VilAmax · max VilBmax − VilB (bj ), przy czym VilBmax oraz VilAmax są wartościami wypłat odpowiednio gracza B i gracza A, w sytuacji gdy gracz B odpowiada w sposób indywidualnie efektywny, a jest współczynnikiem przyjmującym małą wartość (np. = 0, 01). Dla przykładu scenariusze h2 i a1 oraz h2 i a3 mają różną miarę zachęty do odpowiedzi antagonistycznej gracza B. Rozważmy oba scenariusze. • W scenariszu h2 i a1 antagonistyczną odpowiedzią gracza B jest strategia b3 prowadząca do wyniku [1, 3] (strategią indywidualnie efektyną jest strategia b1 prowadząca do wyniku [4, 4]). Stąd: 3 Υ̃B 12 = n o n o = Bmax Amax A (a ), V12 · max V12 − V32 1 Bmax Amax B (b ), V12 · max V12 − V12 3 n o n o = 3. 4 · max 4 − 1, 0.01 4 · max 4 − 3, 0.01 • W scenariszu h2 i a3 antagonistyczną odpowiedzią jest strategia b2 prowadząca do wyniku [2, 2] (strategią indywidualnie efektyną jest strategia b3 prowadząca do wyniku [3, 4]). Stąd: 2 Υ̃B 32 = n o n o = Bmax Amax A (a ), V32 · max V32 − V22 3 Amax Bmax B (b ), V32 · max V32 − V32 2 n o n o = 1/3. 4 · max 3 − 2, 0.01 3 · max 4 − 2, 0.01 Widać zatem, iż dla scenariusza h2 i a1 gracz B odczuwał będzie dużo silniejszą (dziewięmax ciokrotnie większą w sensie wartości współczynnika ΥB ) zachętę do odpowiedzi antagoil nistycznej aniżeli w przypadku scenariusza h2 i a3 . Można się zatem spodziewać, iż strategia ta będzie z większym prawdopodobieństwem wybrana. Zanim jednakże zaproponujemy miary 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 51 prawdopodobieństwa oparte na współczynnikach antagonistycznej zachęty do wyboru określonej strategii bj wyznaczymy wartości tych współczynników dla poszczególnych strategii w ramach rozważanych scenariuszy z gry h1 . • W scenariuszu h1 i a2 istnieje jedna strategia, możliwa do wybrania przez gracza B – b2 , prowadząca do wyniku [3, 4]. Jest to strategia indywidualnie efektywna. Gracz B nie ma więc w tym scenariuszu możliwości wyboru strategii antagonistycznej. • W scenariuszu h1 i a1 dostąpne są dwie strategie antagonistyczne: b2 i b3 prowadzące odpowiednio do wyników [3, 4] i [1, 3] (strategią indywidualnie efektyną jest strategia b1 prowadząca do wyniku [5, 5]). Stąd dla strategii b2 otrzymujemy: 2 Υ̃B 12 = n o n o = Bmax Amax A (a ), V11 · max V11 − V21 1 Amax Bmax B (b ), V11 · max V11 − V11 2 n o n o = 2. n o n o = 2. 5 · max 5 − 3, 0.01 5 · max 5 − 4, 0.01 natomiast dla strategii b3 otrzymujemy: 3 Υ̃B 11 = n o n o = Bmax Amax A (a ), V11 · max V11 − V31 1 Bmax Amax B (b ), − V11 · max V11 V11 3 5 · max 5 − 1, 0.01 5 · max 5 − 3, 0.01 Miara zachęty do wybrania strategii antagonistycznej nie odzwierciedla w pełni wewnętrznych motywów, jakimi kierować się może w swych odpowiedziach gracz B. Miara ta jedynie pokazuje siłę ciążenia w stronę określonych strategii antagonistycznych, wynikającą z chęci pogorszenia wypłaty gracza A przy możliwie małym własnym koszcie. Aby odzwierciedlić pełnię wewnętrznych motywów należałoby stworzyć również odpowiednie miary zachęty do gry w sposób indywidualnie efektywny, jak również do gry w sposób altruistyczny1 , a następnie dla każdej strategii bj dokonać swoistej agregacji owych miar, wynikących z różnych wewnętrznych motywów. Wydaje się jednak, iż to rozumowanie stanowi jedynie ogląd ciekawej i na swój sposób atrakcyjnej ideii, która jednakże pozostać musi w formie abstrakcyjnej. Rozważany problem jest jednakże rzeczywisty, a więc – choćby kosztem znaczących uproszczeń – należy nim się zająć. Przyjmiemy więc, iż gracz A zakłada, iż gracz B w swych decyzjach kierował się będzie jedynie motywami antagonistycznymi, co nie musi oznaczać bynajmniej, iż nie jest zainteresowany wyborem takiej strategii bj , która zostałaby wybrana również wtedy, gdyby gracz B kierował się celem indywidualnie efektywnym2 . Przyjmiemy, iż strategia indywiudualnie efektywna traktowana będzie w jednakowy sposób, jak strategia antagonistyczna, dla której współczynnik antagonistycznej 1 Choć doświadczenie realnych gier rynkowych nakazywałaby graczowi A raczej zakładać, iż te ostatnie nie będą w rzeczywistości dochodzić do głosu. 2 W istocie, w przypadku gdy strategia indywidualnie efektywna wskazuje w sposób jednoznaczny na określoną strategię bj , to na tę samą strategię wskazuje strategia minimalnie antagonistyczna. ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 52 POJEDYNCZEJ PRZEZ GRACZA B zachęty przyjmuje wartość jeden (w istocie, taką wartość przyjmuje ten współczynnik dla strategii indywidualnie efektywnej). Wobec powyższego zdefiniować możemy miarę prawdopodobieństwa wyboru określonej strategii bj , dla określonego scenariusza hl i ai : B Υ̃ j pilj = P ilB , k k Υ̃il (3.6) przy czym sumowanie w mianowniku odbywa się jedynie w ramach możliwych do wybrania przez gracza B strategii bk , dla określonego scenariusza hl i ai . Wobec powyższego otrzymamy: • Dla scenariusza h1 i a1 : p11 1 = 1 = 1/5, 1+2+2 2 = 2/5, 1+2+2 2 = = 2/5. 1+2+2 p11 2 = p11 3 • Dla scenariusza h1 i a2 : p21 2 = 1. • Dla scenariusza h2 i a1 : p11 1 = 1 = 1/4, 1+3 p11 3 = 3 = 3/4. 1+3 • Dla scenariusza h2 i a3 : 1/3 = 1/4, 1 + 1/3 1 = = 3/4. 1 + 1/3 p32 2 = p32 3 Korzystając z wprowadzonych wyżej wartości prawdopodobieńst pilj wyboru przez gracza B określonych strategii bj , dla każdego z rozważanych scenariuszy hl i ai oraz w oparciu o wartości skalarnych miar oceny odpowiadających im wyników gry VilA zdefiniować możemy funkcję agregacji Υ(VilA ) w postaci: Υ(VilA ) = X j pilj · VilA . 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 53 Korzystając z powyższej zależności wyznaczymy wartości poszczególnych scenariuszy w rozważanym przykładzie. • Wartość scenariusza h1 i a1 : A A 11 A 11 A Υ(V11 ) = p11 1 · V111 + p2 · V121 + p3 · V131 = 1/5 · 505 + 2/5 · 304 + 2/5 · 103 = 263, 8. • Wartość scenariusza h1 i a2 : wektor wartości skalarnych [304]. A A Υ(V12 ) = p21 2 · V221 = 1 · 304 = 304. • Wartość scenariusza h2 i a1 : wektor wartości skalarnych [404, 103]. A A 12 A Υ(V12 ) = p12 1 · V112 + p3 · V132 = 1/4 · 404 + 3/4103 = 178, 25. • Wartość scenariusza h2 i a3 : wektor wartości skalarnych [304, 202] A A 32 A Υ(V32 ) = p32 2 · V322 + p3 · V332 = 1/4 · 202 + 3/4 · 304 = 278, 5. Stąd wartość gry h1 wynosi: n o A Υ(V1A ) = max Vi1 = max 263.8, 304 = 304 i zaś wartość gry h2 wynosi: n o A Υ(V2A ) = max Vi2 = max 178.25, 278.5 = 278.5 i 4. W trakcie negocjacji H gracz A winien zabiegać o wybór tej strategii hl , której odpowiada gra pojedyncza hl o największej wartości (agregatu Υ(VlA )). Przy założeniu, że gracz A będzie określał wartość poszczególnych gier w oparciu o przedstawioną w poprzednim punkcie formułę agregacji skalarnych miar możliwych do uzyskania wyników gry dla każdego scenariusza, dochodzimy do wniosku, iż w trakcie rozgrywania gry podwójnej gracz A powinien zabiegać o wybór strategii h1 , jako tej, która doprowadza do gry pojedynczej h1 , która ma największą wartość. Może się to okazać o tyle trudne, iż nie jest ona strategią rekomendowaną przez regulatora, a zatem, jeśli tylko w interesie gracza B będzie jej odrzucenie, po zakończonych negocjacjach ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 54 POJEDYNCZEJ PRZEZ GRACZA B graczom przyjdzie rozegrać grę h2 . Określenie, którą ze strategii opłaca się wybrać graczowi B możliwe jest jedynie przy założeniu znajomości celu do jakiego zmierza3 . Jeśli w trakcie negocjacji zostanie wybrana strategia h1 , wówczas gracz A powinien na rynku detalicznym wprowadzić strategię a2 . Jeśli zaś w trakcie negocjacji zostanie wybrana strategia h2 , wówczas gracz A powinien wybrać strategię a3 . Ostateczny wynik gry określony zostanie przez konkretną odpowiedź bj gracza B. 3.1.2 W grze pojedynczej pierwszy rusza się gracz B: przypadek HBA Próba przewidzenia celu i strategii gracza B Konieczność wykonywania ruchu jako pierwszy w grze pojedynczej w ogólności osłabia możliwość i motywację do ryzgrywania gry w sposób antagonistyczny. Wynika to z dwóch powodów: 1. Gracz wykonujący ruch jako pierwszy, jeśli tylko nie zna celu do jakiego dążył będzie gracz wykonujący ruch jako drugi, nie może jednoznacznie określić wyniku, jaki się w ostateczności ustali. W ten sposób nie jest w stanie przewidzieć ostatecznej wartości własnej funkcji wypłaty dla gry w sposób antagonistyczny. 2. Przy założeniu znajomości celu do jakiego dąży gracz wykonujący ruch jako drugi, rozgrywanie gry w sposób antagonistyczny przez gracza wykonującego ruch jako pierwszy może zostać potraktowane jako prowokacja, na którą gracz wykonujący ruch jako drugi odpowie w sposób niezgodny z pierwotnie zamierzonym celem . Jakie płyną stąd wnioski dla rozważanego przypadku gry pojedynczej BA, w której gracz A nie zna celu do jakiego dąży gracz B? Czy można założyć, że sytuacja, w której znajduje się gracz B przynagla go zmierzania do celu indywidualnie efektywnego? A jeśli nawet wartość jego własnej funkcji wypłaty stanie się jego podstawową miarą oceny uzyskanego wyniku, to czy można w ten sposób wskazać jednoznacznie określoną strategię bj , którą w danej grze pojedynczej hl gracz ten wybierze? Można by się pokusić o następujące rozumowanie. Przy założeniu, że gracz B nie zna celu do jakiego dąży gracz A4 , gracz A mógłby wnioskować, iż gracz B, z racji na osłabioną możliwość i motywację rozgrywania gry w sposób antagonistyczny, dążył będzie do rozgrywania gry w 3 Ten przypadek rozpatrywany był w ramach wcześniejszych analiz przeprowadzonych w punkcie 2.1, przy założeniu, że gracz A rusza się jako drugi i gracz B zna cel, do jakiego A zmierza. Aby wyniki tamtych analiz przełożyć na rozważany w tym miejscu przypadek należy zamienić jedynie indeksowanie graczy: A = B, B = A. 4 To założenie tylko z pozoru wygląda na oczywiste. Gracz A rzecz jasna zawsze może sobie pozwolić na ustaloną w wewnętrznie zmianę celu z zachowaniem jednocześnie dużego prawdopodobieństwa, że gracz B tej informacji nie będzie posiadał. Z drugiej jednak strony, zewnętrzna sytuacja w pewnym sensie może determinować zbiór 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 55 sposób indywidualnie efektywny. W ten sposób sprowadzilibyśmy problem do omawianego w rozdziale 2.1 przypadku, w którym w grze pojedynczej gracz B wykonuje ruch jako pierwszy, a gracz A zna cel do jakiego dąży gracz B. Jednakże jak wynika z tamtejszych analiz, znajomość celu do jakiego dąży gracz B w sytuacji, gdy wykonuje on ruch jako drugi nie przekłada się w sposób jednoznaczny na znajomość strategii bj jaką wybierze. Wynika to z faktu, iż gracz B nie zna celu do jakiego dąży gracz A. Zgodnie ze wsześniejszymi ustaleniami w interesia gracza A byłoby poinformowanie gracza B do jakiego celu zamierza dążyć tak, by w ten sposób ułatwić graczowi B podjęcie decyzji, a co za tym idzie uczynić ją dla siebie bardziej przewidywalną. To jednakże przeczy pierwotnie przyjętemu założeniu, iż gracz B nie zna celu do jakiego dąży gracz A. Problem polega więc tu na tym, że jeśli nawet, w sytuacji gdy gracz A wie, że gracz B nie zna celu, do jakiego A będzie zmierzał, to – na mocy pierwszego uzasadnienia osłabienia możliwości i motywacji do rozgrywania gry w sposób antagonistyczny – gracz A może z pewnym prawdopodobieństwem założyć, że B dąży do celu indywidualnie efektywnego, to jednak ta informacja jest niewystarczająca do tego, by jednoznacznie wskazać strategię bj , którą gracz B wybierze. Aby tę strategię móc wskazać, gracz A musiałby po pierwsze poinformować gracza B do jakiego celu sam zmierza (jaką strategię ai wybierze w odpowiedzi na określoną strategię bj , a po drugie, musiałby mieć pewność, że gracz B, posiadając już taką informację, mimo wszystko będzie chciał zmierzać do celu indywidualnie efektywnego. Możliwą jest bowiem sytuacja, że gracz B, znając cel do jakiego zmierzać będzie gracz A zechce zagrać w sposób antagonistyczny. Znajomość celu, do jakiego dąży gracz A na nowo przywraca możliwość i motywację rozgrywania gry przez gracza B w sposób antagonistyczny. Pierwszy problem, który gracz A musi więc rozstrzygnąć dotyczy wyboru jednej z dwóch sytuacji: 1. Gra ze znanym (założonym z dużym prawdopodobieństwem) celem gracza B, ale nieznaną strategią bj . 2. Gra z nieznanym celem gracza B. Sytuacja pierwsza jest rezultatem nieinformowania gracza B na tema celu, jaki gracz A chce osiągnąć. Na mocy powyższych analiz gracz A może z pewnym prawdopodobieństwem przyjąć, że w tej sytuacji gracz B będzie dążył do celu indywidualnie efektywnego. Sytuacja druga jest rezultatem poinformowania gracza B na temat celu, do jakiego dąży gracz A. Jeśli gracz A zdecyduje się na wariant pierwszy, wówczas może analizować grę w oparciu o narzędzia przedstawione w poprzednim rozdziale, w którym rozważany był przypadek, w którym rozsądnych celów, których znajomość będzie oczywista dla każdego, kto tę sytuację podda analizie (np. operator mający trudności z płynnością finansową zapewne unikał będzie ruchów, które jego sytuację jeszcze miałyby pogorszyć). ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 56 POJEDYNCZEJ PRZEZ GRACZA B znany graczowi A był cel gracza B 5 , natomiast gracz B nie znał celu gracza A (przypadek HBA). Jeśli zdecyduje się nieinformować gracza B na temat celu, do jakiego dąży, wówczas użyteczne będą dla niego narzędzia, przedstawione w dalszej części niniejszego punktu. Na pierwszy rzut oka wydawać się może, iż wariant pierwszy jest dla gracza A korzystniejszy i to z dwóch powodów. Pierwszy powód zasadza się na porównaniu obu wariantów. W wariancie pierwszym gracz A nie zna jedynie konkretnej strategii bj , jaką wybierze gracz B, jednakże zna (czy może raczej z dużym prawdopodobieństwem przewiduje) cel do jakiego B zmierza, a więc mógłby przynajmniej w świetle tego celu odrzucić te strategie bj , których wybór nie byłby (w świetle tego celu) dla gracza B korzystny. Druga korzyść dla gracza A z wyboru tego wariantu wypływa z faktu możliwości nieinformowania gracza B na temat celu, do jakiego sam zmierza. Wybór pomiędzy tymi wariantami nie jest jednakże tak prosty. Po pierwsze istotna jest tu wielkość owego prawdopodobieństwa, że faktycznie gracza B zmierzał będzie do celu indywidualnie efektywnego. Owo prawdopodobieństwo zależy bowiem w głównej mierze nie od tego, że gracz B w grze pojedynczej rusza się jako pierwszy, ale od wartości miary zachęty do atagonistycznej odpowiedzi gracza A. Jeśli wartość tej miary będzie nieduża, to gracz B może mimo wszystko wybrać antagonistyczną strategię w przekonaniu, że graczowi A nie będzie opłacało się odpowiedzieć w sposób antagonistyczny. Innymi słowy gracz B może w określonych przypadkach z bardzo dużym prawdopodobieństwem odczytać, jaka będzie odpowiedź gracza A na określoną jego strategię bj , bądącą wyrazem jego antagonistycznego celu. Przykład 3.2 Dla przykładu w grze pojedynczej z macierzą wypłat jak w tabeli 3.2 wybór strategii b2 jest oczywistym wyrazem antagonistycznego nastawienia gracza B do gracza A. A przy tym, co łatwo stwierdzić gracz B nie musi się zbytnio obawiać, że w rezulatacie tej decyzji może spotkać się z jakąś zemstą ze strony gracza A. Rezygnacja z wyboru strategii a3 byłaby bowiem dla gracza A nazbyt kosztowna. Po drugie możliwość redukcji liczby strategii bj maleć będzie wraz ze wzrostem liczby strategii ai , które w odpowiedzi gracza A mógłby wybrać. Wraz ze wzrostem liczby strategii ai wzrastała będzie liczba możliwych wyników dla każdej strategii bj , a co za tym idzie – w ogólności – tym trudniej będzie wskazać wektory dominujące w sensie mimo wszystko nie dość konkretnie zdefiniowanego celu, jak chęć uzyskania jak najlepszej wartości wypłaty dla siebie. Konkretyzacja celu domagałaby się tu prócz znajomosci podstawowej miary oceny wyniku gracza B (tu 5 Rzecz jasna zawsze będzie możliwość, iż gracz B kierował się będzie nawet w tej sytuacji celem antagonisty- cznym, co przy odpowiedniej strukturze macierzy wypłat może nie być trudne. 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 57 Tabela 3.2: Odwaga gry w sposób antagonistyczny przez gracza B. a1 a2 a3 b1 [3,2] [4,3] [6,5] b2 [2,0] [3,0] [6,4] maksymalizacja wartości jego funkcji), również znajomości jego stosunku do ryzyka, związanego z potencjalną odpowiedzią gracza A. Paradoksalnie, nieznajomość celu do jakiego dąży gracz A, co zawsze może zostać uznane, za dążenie do celu antagonistycznego, może stanowić doskonałe usprawiedliwienie dla realizacji antagonistycznego celu gracza B. Przykład 3.3 Jeśli dla przykładu macierz przedstawia się jak w tabeli 3.3 wybór strategii b2 może być motywowany tak zarówno antagonizmem gracza B, jak też indywidualnie efektywnym celem połączonym z obawą przed antagonizmem gracza A. Tabela 3.3: Trudność z odczytaniem motywacji gracza B: mądrość, czy antagonizm?. a1 a2 b1 [1, 3] [3, 4] b2 [2, 1] [2, 1] W szczególnych przypadkach rozsądnym podejściem ze strony gracza A może się okazać podejście polegające na poinformowaniu gracza B na temat celu, do jakiego gracz A dążył będzie w grze pojedynczej (deklaracja gry w sposób indywidualnie efektywny) i założenie, że gracz B dążył będzie do celu indywidualnie efektywnego obawiając się, iż potencjalna strategia antagonistyczna bj zostanie przez gracza A odebrana jako prowokacja. Gracz A może też złożyć deklarację warunkową, że grał będzie w sposób indywidualnie efektywny, jeśli gracz B grał będzie w ten sam sposób, a zarazem, że jego odpowiedź będzie antagonistyczna, jeśli gracza B zagra w sposób antagonistyczny. ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 58 POJEDYNCZEJ PRZEZ GRACZA B Przykład 3.4 Dla przykładu w przypadku gry pojedynczej z macierzą wypłat jak w tabeli 3.4 w oczywisty sposób strategia b2 jest antagonistyczną strategią gracza B, uniemożliwiającą uzyskanie graczowi A największej, dostępnej dla strategii b1 wartości wypłaty równej 6 (wynik odpowiedzi a4 ). Będąc na etapie rozgrywania gry podwójnej, do określenia wartości przedstawionej gry pojedynczej gracz A potrzebuje wiedzieć, do jakiego celu dążył będzie gracz B, co w tym przypadku oznacza odpowiedź na pytanie, którą ze strategii bj gracz B wybierze. W tej sytuacji, jeśli gracz A dąży do celu indywidualnie efektywnego, to w jego interesie jest poinformowanie gracza B, że zamierza rozegrać grę w sposób indywidualanie efektywny, jeśli gracz B wybierze strategię b1 , natomiast, iż wybierze zagra w sposób antagonistyczny, wybierając np. strategię a2 , jeśli gracz B wybierze strategię b2 . Tabela 3.4: Obawa gry w sposób antagonistyczny przez gracza B. a1 a2 a3 a4 b1 [1, 1] [1, 3] [5, 5] [6, 6] b2 [1, 1] [1, 3] [5, 4] [6, 5] W tej sytuacji przekazanie informacji graczowi B na temat sposobu rozegrania gry przez gracza A, ułatwia graczowi B przewidzenie tak zarówno sposobu rozegrania gry przez gracza B, jak też konkretnej strategii, jaką wybierze i w ostateczności wyniku gry. Groźba jako narzędzie realizacji celu indywidualnie efektywnego gracza A Przykład 3.4 stanowił ilustrację sytuacji, giedy groźba gry w sposób antagonistyczny stanowiła skuteczne narzędzie realizacji celu indywidualnie efektywnego, poprzez utrudnienie drugiemu graczowi gry w sposób antagonistyczny. Groźba gry w sposób antagonistyczny jednakże może stanowić skuteczne narzędzie nie tylko w w sensie powstrzymania drugiego gracza (tu gracza B) przed rozgrywaniem gry w sposób antagonistyczny. Jest to również narzędzie skuteczne wówczas, gdy rozgrywanie gry w sposób indywiudalnie efektywny przez jednego gracza (B), nie szłoby w parze z najlepszą realizacją celu indywidualnie efektywnego przez drugiego gracza (A). W istocie bowiem, nawet obustronne dążenie do indywidualnie efektywnego celu, nie musi bynajmniej oznaczać, iż rozgrywana gra pozbawiona jest jakichkolwiek napięć. O ile tylko gracze dążą do uzyskania dwóch różnych wyników gry o tyle też będzie między nimi rywalizacja. W 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 59 dążeniu do uzyskania indywidualnie efektywnego celu zawiera się więc wielokrotnie konieczność doprowadzenia do sytuacji, w której drugi gracz otrzyma wypłatę gorszą, niżby sobie tego życzył. Nie jest to jednakże równoznaczne z antagonizmem rozumianym jako stawianie sobie za cel tej wypłaty pogorszenie. Dla przykładu, gracz B może otrzymać wypłatę gorszą, niż ta, którą chciałby osiągnąć nie dlatego, że jest to bezpośrednim celem gracza A, ale dlatego, że maksymalizacja wypłaty gracza A nie musi iść w parze z maksymalizacją wypłaty gracza B. Innymi słowy gra, w której gracze dążą do indywidualnie efektywnych celów w większości przypadków nie będzie grą pozbawioną elementu współzawodnictwa. Co więcej, gracz wykonujący ruch jako drugi (tu gracz A), może wysuwać groźby gry w sposób antagonistyczny, tylko po to, by w najlepszy sposób zrealizować cel indywidualnie efektywny. Przykład 3.5 Rozważmy grę z macierzą wypłat jak w tabeli 3.5. Załóżmy, że obaj gracze dążą do celu indywidualnie efektywnego, co obu graczom jest wiadome. W tej sytuacji z punktu widzenia indywidualnie efektywnego celu gracza B korzystnym jest wybranie strategii b2 . Rzecz jasna indywidualnie efektywna odpowiedź gracza A (tu strategia a2 ) jest dla gracza B odpowiedzią najbardziej korzystną. W tej sytuacji ustali się zapewne wynik [4, 3]. Tabela 3.5: Niepożądane z puntku widzenia gracza A dążenie gracza B do celu indywidualnie efektywnego. a1 a2 b1 [3, 4] [2, 0] b2 [0, 2] [4, 3] Łatwo zauważyć, ze z punktu widzenia indywidualnie efektywnego celu gracza A korzystniej byłoby doprowadzić do wyniku [3, 4]. W tej sytuacji wysunięcie groźby wybrania strategii a1 w odpowiedzi na strategię b2 mogłoby się okazać posunięciem skutecznym, przymuszającym gracza B do wyboru strategii b1 . Istotnym jest tu owo rozróżnienie, iż w tym przypadku groźba gry w sposób antagonistyczny jest jedynie strategicznym posunięciem gracza A mającym na celu jak najlepszą realizację celu indywidualnie efektywnego, nie zaś wyrazem rzeczywistego, antagonistycznego nastawienia gracza A. Gdyby przewodnim był ów drugi motyw, wówczas rozsądniej byłoby dla gracza A nie ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 60 POJEDYNCZEJ PRZEZ GRACZA B informować o tym gracza B. Więcej nawet, rozsądną byłaby deklaracja (rzecz jasna niewiarygodna) gry w sposób indywidualnie efektywny. Korzyść z przekazania informacji na temat antagonistycznego celu gracza A W odróżnieniu od sytuacji omawianej wyżej, kiedy to groźba gry w sposób antagonistyczny stanowiła jedynie strategiczne posunięcie, mające na celu zapewnienie jak najlepszej realizacji celu indywidualnie efektywnego, a co się z tym wiąże groźba ta dotyczyła jedynie określonej (w ogólności określonych) strategii gracza B, możliwa jest również sytuacja, w której cel antagonistyczny stanowi dla gracza A cel podstawowy, który zamierza realizować niezależnie od decyzji, jaką podejmie gracz B. Na pierwszy rzut oka oczywistym wydaje się w tym momencie wniosek, iż nie jest w interesie gracza A informowanie gracza B na temat celu, do jakiego zmierza. Gracz B po pierwsze może utrudnić realizację tego celu, wybierając strategię inną, niżby wybrał mając świadomość, że gracz A dążył będzie do celu indywidualnie efektywnego. Po drugie zaś, świadomość, że gracz A dąży do celu antagonistycznego może stać się powodem do tego, by w oparciu o tę wiedzę opracować własną antagonistyczną strategię, jako swoisty „uprzedzający odwet” za antagonizm gracza A. W praktyce jednak okazuje się, że są sytuacje, w których poinformowanie o antagonistycznym celu gracza A może być korzystne nie tylko dla gracza B (co oczywiste), który w ten sposób może się jakoś zabezpieczyć, przed antagonizmem gracza A, ale również dla samego gracza A. Przykład 3.6 Macierz wypłat w grze pojedynczej przedstawia się jak w tabeli 3.6. Gracz B zmierza do celu indywidualnie efektywnego. Gracz A dąży do celu antagonistycznego zdefiniowanego jako chęć utrzymania odległości pomiędzy wypłatami graczy równej 2. W przypadku niejednoznaczności, gracz A wybiera tę strategię, która da mu lepszą wartość wypłaty. Tabela 3.6: Przykład gry, w której korzystnym dla obu graczy jest poinformowanie gracza B na temat antagonistycznego celu, do jakiego dąży gracz A. a1 a2 b1 [1, 3] [4, 5] b2 [2, 4] [1, 2] Jeśli gracz B sądzi, że gracz A dąży do celu indywidualnie efektywnego, wówczas wybierze 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 61 strategię b1 , spodziewając się odpowiedzi a2 i wyniku [4, 5]. Gracz A wybierze jednak zgodną z jego antagonistycznym celem strategię a1 , co da wynik [1, 3]. Co by się stało, gdyby gracz A poinformował gracza B na temat celu do jakiego dąży? Oczywiście, jeśli gracz B dążyłby do celu indywidualnie efektywnego wybrałby strategię b2 spodziewając się odpowiedzi a1 , co dałoby wynik [2, 4] – lepszy dla obu graczy. W powyższym przykładzie gracz zarówno gracz A jak i gracz B odnieśli korzyść z poinformowania gracza B odnośnie antagonistycznego celu, do jakiego dąży gracz A. Uzyskany w ten sposób wynik jest lepszy dla obu graczy, niżby to było w przypadku nie przekazywania tej informacji. Stwierdzić jednak trzeba, że o ile w kontekście tak zdefiniowanego antagonistycznego celu, wynik [2, 4] jest dla gracza A lepszy niż wynik [4, 5], to bynajmniej dla gracza B tak już nie jest. Korzyść gracza B wynika jedynie z pozyskania iformacji na temat celu, nie zaś z samego faktu, że ten cel jest antagonistyczny. Zajść jednak może przypadek, kiedy to sama antagonistyczność celu gracza A okazać się może korzystna dla gracza B. Będzie tak wtedy, gdy również i gracz B dążył będzie do celu antagonistycznego. Indywidualnie efektywna korzyść gracza A z niewiarygodnej deklaracji gry w sposób indywidualnie efektywny Przykłady 3.4 oraz 3.5 ilustrowały sytuacje, w których z punktu widzenia indywidualnie efektywnego celu gracza A korzystnie było dla niego wysunąć groźbę, odstąpienia od tego celu na rzecz celu antagonistycznego. Ta groźba przymuszała gracza B do wybrania strategii korzystniejszej dla gracza A z punktu widzenia jego indywidualnie efektywnego celu. W tym miejscu przedstawimy przykład narzędzia wywierania bardziej subtelnej presji na gracza B, która przymusza go do rezygnacji ze strategii, którą wybrałby mając pewność, że gracz A grał będzie w sposób indywidualnie efektywny. Tym narzędziem jest niewiarygodna obietnica gry w sposób indywidualnie efektywny. Przykład 3.7 Rozważmy przykład gry z macierzą wypłat jak w tabeli 3.7. Załóżmy, że gracz B dąży do celu indywidualnie efektywnego. Jeśli gracz A deklarował będzie dążenie do indywidualnie efektywnego celu, wówczas w interesie gracza B jest wybór strategii b1 , co w rezultacie indywidualnie efektywnej odpowiedzi gracza A – a2 doprowadzi do wyniku [3, 4]. Jeśli jednakże owa deklaracja wybrzmi jako niewiarygodna wówczas, z obawy przed antagonistyczną odpowiedzią a1 , gracz B może nie być skłonny do wyboru strategii b1 (co doprowadziłoby do wyniku [1, 3]). Wątpiąc w wiarygodność deklaracji gracza A, gracz B może być skłonny ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 62 POJEDYNCZEJ PRZEZ GRACZA B Tabela 3.7: Korzystna niewiarygodność. a1 a2 b1 [1, 3] [3, 4] b2 [2, 5] [2, 1] wybrać strategię bardziej dla siebie ostrożną – b2 . Jeśli mimo wszystko gracz A wybierze strategię a1 , wówczas osiągnie wynik lepszy (z punktu widzenia indywidualnie efektywnego celu – [2, 5], aniżeli byłoby to w przypadku, gdyby gracz B wybrał strategię b1 . Wynika stąd ogólny wniosek, iż niewiarygodność dążenia do indywidualnie efektywnego celu może się okazać korzystna z punktu widzenia realizacji tego celu. Rzecz jasna ten sam cel, gracz A uzyskać mógłby wysuwając przekonującą groźbę gry w sposób antagonistyczny, której następnie, po wyborze przez gracza B strategii b2 by nie spełnił. Składanie mało wiarygodnych deklaracji gry w sposób indywidualnie efektywny może być jednakże korzystniejsze z dyplomatycznego punktu widzenia aniżeli wysuwanie przekonujących gróźb gry w sposób antagonistyczny. W pierwszym przypadku można być co najwyżej uznany za posiadającego mało wiarygodne dobre pragnienia, w drugim ocena jest już dużo bardziej krytyczna. Mamy więc tu do czynienia z paradoksalnym i na swój sposób nieszczęsnym przypadkiem, w którym bycie wiarygodnym nie popłaca. Antagonistyczna korzyść gracza A z niewiarygodnej deklaracji gry w sposób indywidualnie efektywny Idąc za przykładem sytuacji omówionej wyżej łatwo wysunąć przykład, w którym gracz A, dążąc do realizacji celu antagonistycznego korzysta na tym, że gracz B wierzy w jego niewiarygodną deklarację gry w sposób indywidualnie efektywny. Jeśli w ramach gry, jak w przykładzie 3.7 gracz A złoży deklarację gry w sposób indywidualnie efektywny, to może odnieść dużą korzyść (zmierzając do np. maksymalnie antagonistycznego celu), jeśli gracz B w tę deklarację uwierzy, wybierając strategię b1 . Ogólne stwierdzenie jest więc takie, że w zależności od sytuacji, gracz A może odnieść korzyść, rozumianą w sensie celu do jakiego zmierza, tak z faktu przekazania graczowi B wiarygodnych jak i niewiarygodnych informacji na temat celu do jakiego dąży. 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 63 Kwestia wiarygodności deklaracji gry w określony sposób Poza mimo wszystko wyjątkowymi przypadkami, kiedy to gracz A może odnieść korzyść z faktu bycia niewiarygodnym (patrz przykład 3.7), odbieranie przez gracza B składanych przez gracza A deklaracji gry w określony sposób jako deklaracji wiarygodnych, będzie dla gracza A w wielu przypadkach korzystne. I będzie to korzystne tak zarówno wówczas, gdy ową deklarację zamierza wypełnić, jak też ją złamać6 . Dlatego też w takich przypadkach intencją gracza A będzie czynienie owych deklaracji jak najbardziej wiarygodnymi. Dla gracza B znajomość celu do jakiego dąży gracz A równoznaczna jest z możliwością określenia konkretnej strategii ai , jaką gracz A wybierze w odpowiedzi na określoną strategię bj . To pozwala w sposób dokładny przewidzieć, jaki ustali się wynik danej gry pojedynczej. Wynik ten, przekształcony na wartość skalarną odzwierciedlającą cel, to którego zmierza gracz B pozwala mu określić wartość, jaką ma dla niego każda z gier pojedynczych hl . A zatem informacja o celu do jakiego dąży gracz A pozwala graczowi B dokonać oceny wartości każdej z dostępnych w trakcie negocjacji strategii hl . W szczególności zaś, pozwala mu wskazać tę strategię, o którą warto mu w trakcie negocjacji najbardziej zabiegać. Analogiczna informacja dla gracza A nie jest wystarczająca, do określenia wartości poszczególnych strategii hl . Graczowi A nie wystarczy wiedzieć, do jakiego celu dąży gracz B, by wskazać jednoznacznie strategię bj , jaką w trakcie rozgrywania gry pojedynczej gracz ten wybierze. Gracz A musi nie tylko wiedzieć, do jakiego celu dąży gracz B, ale również musi mieć pewność, że gracz B wie, do jakiego celu dąży gracz A. W tym sensie wyzwanie przed graczem A jest tu większe. Graczowi B wystarczy poznać cel gracza A. Gracz A zaś musi poznać cel gracza B i przekonać gracza B, że informacja, którą graczowi B przekazuje na temat własnego celu, jest informacją wiarygodną (i taką w rzeczywistości być może, choć nie musi). Co więcej, poinformowanie drugiego gracza, na temat celu do jakiego dany gracz zamierza dążyć jest dla gracza B istotne jedynie na etapie rozgrywania gry podwójnej, co ułatwić może wybór określonej strategii hl (zgodę gracza A na jej ustalenie). W przypadku gracza A jest to również istotne na etapie rozgrywania gry pojedynczej, co ma zapewnić wybór pożądanej przez gracza A strategii bj . Stąd też o ile deklaracje rozgrywania gry w określony sposób (dążenie do określonego celu) gracz B może składać jedynie przed, lub w trakcie rozgrywania gry podwójnej (przed ustaleniem strategii hl ), o tyle gracz A może to również czynić w trakcie rozgrywania gry pojedynczej (przed 6 Pomijamy w tym miejscu niezwykle istotny wątek moralny i kulturowo-twórczy (a może raczej dla owej kultury destrukcyjny), związany z decyzją świadomego wprowadzania w błąd i składaniem deklaracji, których dotrzymać się nie zamierza. Jest to oczywisty koszt niedotrzymywania złożonych deklaracji. Pomijamy rówież w tym miejscu osłabienie ogólnej wiarygodności gracza A, na skutek złamanej deklaracji, jako oczywisty koszt (w wielu przypadkach znacząco przewyższający jednorazową korzyść) podjętej decyzji, który z pewnością zaciąży na dalszej współpracy graczy. ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 64 POJEDYNCZEJ PRZEZ GRACZA B ustaleniem strategii bj ). Z tego też powodu gracz A może złożyć dwie, niekoniecznie jednakowe deklaracje. Dla przykładu pierwsza, na etapie rozgrywania gry podwójnej może być deklaracają gry w sposób indywidualnie efektywny (co może, choć nie musi zachęcić gracza B do ujawnienia celu, do jakiego sam zamierza dążyć), druga – deklaracją (choćby warunkowa) gry w sposób antagonistyczny. Spójność składanych deklaracji wzmacnia ich wiarygodność. Z tego też powodu, druga ze składanych przez gracza A deklaracji wybrzmi bardziej wiarygodnie wówczas, gdy będzie potwierdzeniem deklaracji pierwszej. Na wzmocnienie lub osłabienie wiarygodności deklaracji złożonej na etapie rozgrywania gry pojedynczej wpłynie też niewątpliwie sam sposób prowadzenia negocjacji na etapie gry podwójnej. Ów sposób stanowić może również potwierdzenie lub zaprzeczenie wiarygodności deklaracji złożonej przed czy w trakcie przeprowadzanych negocjacji. Rzecz jasna zależności te nie muszą być ani jednoznaczne, ani tym bardziej łatwe do odczytania7 . Zbieżność strategii antagonistycznych: zmiana znaczenia pojęcia „efektywność” Cel do jakiego dążą gracze (indywidualnie efektywny lub antagonistyczny) jest wyrazem ich stosunku do wypłaty własnej, jak też gracza drugiego. Wprowadzona w poprzednim rozdziale skalarna miara oceny poszczególnych wyników gry umożliwia uszeregowanie tych wyników pod względem ich wartości w kontekście owego celu. A zatem, jeśli nawet gracze są zainteresowani rozgrywaniem gry w sposób antagonistyczny, to sukces w tej materii mierzą jedynie w oparciu o własną skalarną miarę oceny uzyskanego wyniku, nie mierzą jej bynajmniej w oparciu o skalarną miarę oceny odzwierciedlającej cel drugiego gracza. Jest to spostrzeżenie o tyle istotne, iż przynajmniej teoretycznie możliwa jest sytuacja, kiedy to nawet rozgrywając grę w sposób wzajemnie antagonistyczny obaj gracze odniosą subiektywny „sukces”. Będzie tak wówczas, kiedy ich antagonistyczne cele będą na swój sposób zbieżne. Przykład 3.8 Rozważmy przykład gry z macierzą wypłat jak w tabeli 3.8. Załóżmy, iż gracze kierują się następującymi strategiami antagonistycznymi: • Gracz A: Dążenie do maksymalizacji własnej funkcji wypłaty, przy założeniu, że odległość pomiędzy wypłatami graczy będzie wynosiła conajmniej 2. • Gracz B: Dążenie do maksymalizacji własnej funkcji wypłaty, przy założeniu, że wypłata gracza A będzie nie większa niż 4. 7 Pominiemy w tym miejscu rozwinięcie tego wątku. 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 65 Tabela 3.8: Zbieżność antagonizmów. a1 a2 b1 [1, 3] [3, 4] b2 [2, 4] [4, 5] Jeśli w tej sytuacji gracz B sądził będzie, że gracz A dąży do celu indywidualnie efektywnego, wówczas wybierze strategię b1 , spodziewając się wyniku [3, 4]. Niestety odpowiedzią gracza A będzie strategią a1 , co doprowadzi do wyniku [1, 3]. Gdyby gracz B znał cel gracza A, wówczas wybrałby strategię b2 , a ostateczny wynik [2, 4], byłby w sensie antagonistycznych celów graczy najlepszym z możliwych do uzyskania w tej grze. W powyższym przykładzie, w w interesie obu graczy było uzyskanie wyniku [2, 4], co odpowiadało wyborowi strategii b2 i a1 . Istotnym jest tu spostrzeżenie, że nie jest to bynajmniej wynik efektywny z punktu widzenia indywidualnie rozważanych funkcji wypłaty obu graczy. Mamy tu przypadek, kiedy to antagonistyczne podejście do gry zmienia subiektywne znaczenie pojęcia „efektywność”. Można by wysunąć twierdzenie, iż ta zmiana znaczenia pojęcia efektywność poddaje w wątpliwość słuszność ewentualnej ingerencji regulatora, zmierzających do uzyskania wyniku [4, 5] (np. poprzez przymuszenie gracza A do wyboru strategii a2 , jako dominującej w sensie indywidualnie efektywnego celu strategię a1 ). W istocie ingerencja regulatora okazałaby się błędną, jeśli w korzyściach z uzyskanego wyniku partycypują jedynie gracze A i B 8 . Błąd regulatora polegałby na nierozpatrzeniu wszystkich, istotnych dla graczy kryteriów oceny wyniku gry, w szczególności kryteriów określających pożądany stosunek pomiędzy wartościami funkcji wypłaty poszczególnych graczy, a skupieniu się jedynie na jednym, polegającym na dążeniu do uzyskania jak największej wartości własnej funkcji wypłaty. Przyklad 3.8 pokazuje w sposób wymowny, iż zgodnie z wprowadzoną tu definicją strategii antagonistycznej nie jest ona w ogólności wyrazem chęci „pokrzyżowania planów” drugiemu graczowi, utrudnienia mu realizacji celu, jaki sobie zakłada. W tym sensie strategia antagonistyczna nie jest strategią „złośliwą”. Jest raczej strategią „egoistyczną”, rozumianą jednakże w ten sposób, że celem danego gracza staje się nie tylko uzyskanie jak najlepszej wartości własnej funkcji wypłaty, ale również ustalenie określonego (pożądanego ze swego punktu widzenia) poziomu wypłaty drugiego gracza. Jednym słowem celem danego gracza staje się nie tylko uzyskanie 8 Jeśli dla przykładu wynik [4, 5] okazałby się korzystniejszy od wyniku [2, 4] ze społecznego punktu widzenia, wówczas ingerencja regulatora byłaby na mocy owej korzyści uzasadniona. ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 66 POJEDYNCZEJ PRZEZ GRACZA B określonej wartości własnej funkcji wypłaty, ale również ukształtowanie odpowiedniego kontekstu dla tej wartości, ukształtowanie wartości wypłat innych graczy, z którymi wartość swojej porównuje. Innymi słowy podstawową miarą sukcesu stają się nie tyle wartości bezwzględne ale właśnie względne, wynikające z oceny jak własna wartość plasuje się na tle wartości uzyskanych przez innego (innych) graczy. Paradoksalnie nawet najbardziej antagonistyczna strategia (gracza A), polegająca na dążeniu w pierwszym rzędzie do minimalizacji wartości wypłaty drugiego gracza (B) może się okazać strategią najbardziej korzystną dla tego (B) gracza, jeśli ten również kieruje się celem antagonistycznym. Przykład 3.9 Rozważmy przykład gry z macierzą wypłat jak w tabeli 3.9. Tabela 3.9: Przykład gry, w której maksymalnie antagonistyczny cel gracza A jest dla gracza B korzystny. a1 a2 a3 a4 b1 [1, 2] [2, 3] [4, 3] [3, 5] b2 [2, 4] [4, 5] [3, 4] [0, 1] Załóżmy, iż gracze kierują się następującymi strategiami antagonistycznymi: • Gracz A: Dążenie przede wszystkim do minimalizacji wartości wypłaty gracza B, a w przypadku niejednoznaczności wybór tej strategii, która daje większą wypłatę graczowi A (strategia maksymalnie antagonistyczna). • Gracz B: Dążenie do maksymalizacji własnej funkcji wypłaty, przy założeniu, że wypłata gracza A będzie nie większa niż 2. Przy tak zdefinowanych celach, gracz B wybierze strategię b1 , co spotka się z odpowiedzią a1 ze strony gracza A. W rezultacie ustali się wynik [1, 2], który dla gracza B jest w sensie jego celu najlepszym z możliwych w tej grze. Nie jest to jednakże wynik najbardziej – w sensie jego maksymalnie antagonistycznego celu – korzystny dla gracza A. Gracz A wolałby, aby ustalony został wynik [0, 1], jako rezultat wyboru strategii b2 i a4 . 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 67 Jeszcze większy paradoks polega na tym, że strategia minimalnie antagonistyczna, polegająca na dążeniu do maksymalizacji własnej funkcji wypłaty, a w przypadku niejednoznaczności, na wyborze strategii dającej mniejszą wartość wypłaty drugiemu graczowi, może stać się narzędziem najbardziej skutecznym, dla wyrażenia złośliwego podejścia do drugiego gracza. Przykład 3.10 Rozważmy przykład gry z macierzą wypłat jak w tabeli 3.10. Tabela 3.10: Przykład gry, w której minimalnie antagonistyczny cel gracza A stanowić może najbardziej skuteczne narzędzie utrudnienia graczowi B realizacji jego celu. a1 a2 a3 a4 b1 [1, 3] [2, 4] [4, 5] [0, 5] b2 [2, 4] [1, 3] [0, 4] [2, 4] W tej sytuacji, niezależnie od celu, do jakiego zmierzał będzie gracz B (indywidualnie efektywnego lub antagonistycznego), realizacja celu minimalnie antagonistycznego gracza A (wybór strategii a4 w odpowiedzi na strategię b1 lub strategii a3 w odpowiedzi na strategię b2 ) w maksymalnym stopniu utrudni graczowi B osiągniecie tego, co zamierzał. W powyższym przykładzie minimalnie antagonistyczny cel gracza A w istocie wskazywał na tę samą strategię ai , co cel maksymalnie antagonistyczny. W szczególnych przypadkach, gdy taka zależność nie zachodzi, minimalnie antagonistyczna strategia gracza A może mimo to najskuteczniej utrudnić realiację celu graczowi B. Przykład 3.11 Rozważmy przykład gry z macierzą wypłat jak w tabeli 3.11. Załóżmy, iż gracze kierują się następującymi strategiami antagonistycznymi: • Gracz A: Dążenie przede wszystkim do maksymalizacji wartości własnej funkcji wypłaty, a w przypadku niejednoznaczności wybór tej strategii, która daje mniejszą wypłatę graczowi B (strategia minimalnie antagonistyczna). • Gracz B: Dążenie do maksymalizacji własnej funkcji wypłaty, przy założeniu, że wypłata gracza A będzie conajmniej o 2 mniejsza niż wsypłata gracza B. ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 68 POJEDYNCZEJ PRZEZ GRACZA B Tabela 3.11: Przykład gry, w której minimalnie antagonistyczny cel gracza A stanowić może najbardziej skuteczne narzędzie utrudnienia graczowi B realizacji jego celu. Cel maksymalnie i minimalnie antagonistyczny gracza A nie wskazują na tę samą strategię ai . a1 a2 a3 a4 b1 [2, 0] [4, 2] [5, 4] [6, 4] b2 [3, 1] [4, 1] [5, 3] [6, 5] W tej sytuacji w odpowiedzi na strategię b1 gracz A wybierze strategię a3 , co doprowadzi do wyniku [5, 4], natomiast w odpowiedzi na strategie b2 , gracz A wybierze strategię b4 , co doprowadzi do wyniku [6, 5]. Mimo minimalnie antagonistycznego celu gracza A, uzyskany przez gracza B wynik będzie najgorszy z możliwych, niezależnie od tego, czy wybierze strategię b1 , czy b2 . Paradoks polega tu na tym, że wynik dla gracza B byłby lepszy (w sensie celu, do którego dąży) nawet wówczas, gdyby gracz A kierował się strategią maksymalnie antagonistyczną. Korzystna dla gracza B groźba ze strony gracza A Powyższe przykłady ilustrują, że nieznajomość celu, do jakiego dąży gracz B nie daje graczowi A gwarancji, że przykładowo wysunięta przez niego groźba (czy też mało wiarygodna deklaracja gry w sposób indywidualnie efektywny) okaże się skuteczna. Może się bowiem okazać, iż w interesie gracza B będzie tej groźby spełnienie (jeśli ten będzie chciał grać w sposób antagonistyczny), a wysunięta przez gracza A groźba wyboru określonej strategii ai , jako odpowiedź na daną strategię bj będzie w istocie tym, co gracz B chciałby osiągnąć. Nieznajomość celu do jakiego dąży gracz B w ogólności osłabia, a w szczególnych przypadkach całkowicie niweluje siłę wysuwanych przez gracza A gróźb (i ewentualnych obietnic). Jednakże nawet tego, czy tak się w istocie dzieje gracz A nie jest w stanie sprawdzić, dopóki nie zna celu do jakiego dąży gracz B. Istnieje w tym również pewne niebezpieczeństwo dla gracza A. Wysunięcie przez niego groźby wyboru określonej strategii ai może w istocie zachęcić gracza B do wyboru takiej strategii, której wybrać się obawiał, a która w połączeniu z realizacjią groźby najlepiej zrealizuje antagonistyczny cel gracza B. Przykład 3.12 Rozważmy przykład gry z macierzą wypłat jak w tabeli 3.12. 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 69 Tabela 3.12: Przykład gry, w której gracza B korzystna na fakcie, iż gracz A wysunął wobec niego groźbę. a1 a2 a3 b1 [5, 4] [5, 7] [5, 4] b2 [3, 6] [2, 4] [2, 3] Załóżmy, iż gracz B kieruje się strategią antagonistyczną, opartą na dążeniu, by gracz A nie otrzymał wypłaty większej niż 4, a jednocześnie, zapewnieniu sobie wypłaty nie mniejszej niż o 2-wie jednostki od wypłaty gracza A. Wobec tak zdefiniowanego celu, trzy wyniki mogą ustatysfakcjonować gracza B: [5, 4] dla strategii b1 i a1 lub a3 , [2, 4] dla strategii b2 i a2 oraz [2, 3] dla strategii b2 i a3 . Jeśli cel gracza A oparty będzie przynajmniej w jakiejś mierze na dążeniu do maksymalizacji własnej funkcji wypłaty, wóczas należy stwierdzić, że wynik [5, 4] nie jest możliwy do uzyskania. Gracz A będzie bowiem preferował nad niego wynik [5, 7], który w przypadku wyboru przez gracza B strategii b1 będzie dostępny dla gracza A poprzez wybór strategii a2 . Gracz B nie powienien też oczekiwać wyniku [2, 3] bowiem nad niego (niezeleżnie od celu – jeśli tylko pozostanie racjonalny – gracza A) z pewnością preferowany będzie wynik [2, 4]. Gracz B przypuszcza, że gracz A kierował się będzie przede wszystkim maksymalizacją własnej funkcji wypłaty, a zatem w odpowiedzi na strategię b1 , gracz A odpowie strategią a2 , co doprowadzi do wyniku [5, 7], natomiast w odpowiedzią na b2 będzie prawdopodobnie strategia b1 , co doprowadzi do wyniku [3, 6]. Wynik [3, 6] nie dość, że przekracza pożądaną przez gracza B wartość wypłaty gracza A, to na dodatek nie zapewnia pożądanego stosunku pomiędzy wypłatami graczy, który w tym przypadku wynosi 3. Wobec tego przyjmijmy, że gracz B preferuje wynik [5, 7] nad wynik [3, 6]. Licząc się z tym, że wynik [2, 4] będzie raczej niemożliwy do osiągnięcia (z racji na przewidywaną preferencję gracza A wskazującą raczej na wynik [3, 6]), gracz B skłonny będzie wybrać strategię b1 . Załóżmy, że gracz A faktycznie dąży w pierwszej kolejności do maksymalizacji własnej fukcji wypłaty. Przy czym wartość 7, jest dla niego radykalnie korzystniejsza, aniżeli wartość 6. W istocie, uzyskanie wartości 7, stanowi swoistą wartość progową, którą gracz A zmuszony jest przekroczyć. Podstawowy koszt, wynikający z otrzymania ewentualnej wartości mniejszej związany jest dla gracza A nie tyle z odległością wartości otrzymanej od pożądanej wartości 7, ile z zamym faktem jej nie osiągnięcia. Gracz A nie wie jednak, do jakiego celu dążdy gracz B, a spodziewając się, że będzie to cel ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 70 POJEDYNCZEJ PRZEZ GRACZA B antagonistyczny dopuszcza, że gracz B może wybrać strategię b2 . Chcąc tego za wszelką cenę uniknąć, gracz A wysuwa groźbę, którą z pełną determinacją zamierza spełnić, jeśli zajdzie ku temu okazja, iż w przypadku wyboru przez gracza B strategii b2 , wybierze strategię a2 . Paradoksalnie właśnie ta groźba i związana z nią wiarygodność jej spełnienia stają się bezpośrednią przyczyną wyboru przez gracza B strategii b2 . Rzecz jasna przedstawione wyżej przykłady traktować należy raczej jako szczególne przypadki, nie zaś zasadę samą w sobie i w ogólności należy się raczej spodziewać, iż im bardziej antagonistycznym celem kierował się będzie dany gracz, tym będzie to z większą szkodą dla drugiego gracza. W szczególności zaś będzie tak zawsze, gdy gracz, przeciwko któremu stosowana jest strategia antagonistyczna, dąży do celu indywidualnie efektywnego (gdy swój sukces mierzy w kategoriach wartości własnej funkcji wypłaty). Wybór strategii hl w grze podwójnej w sytuacji nieznajomości celu, go jakiego dąży gracz B Powyższe przykłady pokazują ograniczoną skuteczność wysuwanych gróźb, jak też niebezpieczeństwa związane z przekazaniem przez gracza A informacji graczowi B, na temat celu do jakiego zmierza, w przypadku, gdy cel gracza B nie jest graczowi A znany. Z punktu widzenia rozgrywania gry podwójnej przed graczem A stoi podwójne wyzwanie: pozyskanie ifnormacji na temat celu gracza B i ewentualne przekazanie mu informacji na temat własnego celu. Tym zagadnieniem zajmiemy się w następnym punkcie. W tym miejscu zaproponowane zostanę metody określania wartości poszczególnych gier pojedynczych, hl , a poprzez to wskazanie najbardziej pożądanych w trakcie negocjacji strategii hl . Rzecz jasna, z racji na nieznajomosć celu gracza B, każda z przedstawionych metod skazana jest na konieczność dokonywania arbitralnych wyborów, a ostateczny wynik gry, może nie mieć dużo wspólnego z przewidywanym. Mimo to wybór, jakiego w trakcie przeprowadzanych w ramach gry podwójnej negocjacji dokona gracz A nie będzie przypadkowy, lecz będzie wynikiem określonego, precyzyjnego rozumowania i w tym sensie, może on zostać uznany za racjonalny. Poniżej ilustrujemy cztery możliwe podejścia, jakie gracz A może tu zastosować9 . • Potraktowanie każdej z gier pojedynczych jako gry przeciwko naturze max • Założenie, że gracz B wybierze strategię z minimalną wartością ΥA jl • Określenie prawdopodobieńst wyboru określonych strategii bj 9 Rzecz jasna możliwych podejść może być więcej. 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 71 • Założenie indywidualnie efektywnego celu obu graczy Potraktowanie każdej z gier pojedynczych jako gry przeciwko naturze W tym podejściu, gracz A ignoruje wszelkie informacje zawarte w macierzy wypłat gracza B, mogące ewentualnie pomóc we wskazaniu, którą ze strategii bj gracz B mógłby wybrać. Wybór określonej strategii bj traktowana jest tu jako wynik przypadku. Informacja o wartościach wypłaty gracza B wykorzystywana jest jedynie do określenia wartości (w sensie celu do jakiego A zmierza), jaką dla gracza A przedstawia określony wynik gry. Procedura postępowania przebiega tu w sposób następujący: Metoda: 1. Przekształcenie oryginalnej macierzy wypłat graczy w macierz skalarnych wartości poszczególnych wyników, odzwierciedlających cel gracza A. 2. Przekształcenie macierzy skalarnych wartości w macierz gry przeciwko naturze. 3. Określenie wartości poszczególnych gier hl w oparciu o określone kryterium wyboru strategii w grze przeciwko naturze. Przykład 3.13 Załóżmy, że macierz wypłat w grze podwójnej przedstawia się jak w tabeli 3.13. Załóżmy, że gracz A dąży do celu indywidualnie efektywnego, dążąc do wyboru strategii, która da mu największą wartość wypłaty. Gracz A nie zna celu, do jakiego dąży gracz B. Gracz A postanawia więc potraktować gracza B jako naturę. Tabela 3.13: Macierz wypłat w grze podwójnej. h1 h2 a1 a2 a3 b1 [2, 3] [3, 1] [1, 4] b2 [2, 2] [5, 3] b3 [3, 2] [3, 4] h3 a1 a2 a3 a1 a2 a3 b1 [1, 2] [2, 3] [3, 2] b1 [2, 5] [3, 4] [4, 3] [3, 5] b2 [5, 2] [4, 3] [4, 4] b2 [1, 1] [2, 5] [2, 5] [4, 2] b3 [2, 3] [3, 2] [2, 3] b3 [3, 3] [3, 2] [2, 3] ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 72 POJEDYNCZEJ PRZEZ GRACZA B 1. Przekształcenie oryginalnej macierzy wypłat graczy w macierz skalarnych wartości poszczególnych wyników, odzwierciedlających cel gracza A. Gracz A kieruje się celem indywidualnie efektywnym. Przyjmiemy więc, że wartość poszczególnych wyników [V A , V B ] określał będzie zgodnie z poniższą formułą. V A [V A , V B ] = V A . (3.8) W oparciu o zależność (3.8) przekształcić możemy oryginalną macierz wypłat graczy, do postaci macierzy 3.14. Tabela 3.14: Macierz skalarnych wartości poszczególnych wyników gry, odzwieciedlających indywidualnie efektywny cel gracza A. h1 h2 a1 a2 a3 b1 3 1 4 b2 2 3 b3 2 4 h3 a1 a2 a3 a1 a2 a3 b1 2 3 2 b1 5 4 3 5 b2 2 3 4 b2 1 5 5 2 b3 3 2 3 b3 3 2 3 2. Przekształcenie macierzy skalarnych wartości w macierz gry przeciwko naturze. Dla utworzenia z macierzy skalarnych wartości poszczególlnych wyników gry, macierzy gry przeciwko naturze gracz A musi jednoznacznie określić strategię, jaką wybierze w odpowiedzi na poszczególne strategie bj , ustalając w ten sposób odpowiadającą im wartość skalarną, a co się z tym wiąże. Ponieważ im większa wartość skalarnej miary wyniku, tym wynik ten jest dla gracza A większy, zatem dla każdej strategii bj gracz A wybierze tę strategię, która da mu największą A (a ). wartość Vhj i A , dla których Elementami macierzy wypłat w grze przeciwko naturze będą takie wartości Vhj zachodzi: A A Vhj = max Vhj (ai ). i (3.9) Jej strategiami zaś, strategie hl , traktowane tu jako strategia gracza A i strategie bj , traktowane jako strategie natury. Stąd, przekształcając zgodnie z zależnością (3.9) otrzymujemy macierz wypłat w grze przeciwko naturze postaci 3.15. 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 73 Tabela 3.15: Macierz wypłat w grze przeciwko naturze, uzyskana z macierzy skalarnych wartości poszczególnych wyników gry. b1 b2 b3 h1 4 5 4 h2 3 4 3 h3 5 5 3 3. Określenie wartości poszczególnych gier hl w oparciu o określone kryterium wyboru strategii w grze przeciwko naturze. Mając problem sformułowany w postaci gry przeciwko naturze, do jego rozwiązania gracz A może zastosować narzędzia analizy właściwe dla tego typu gier [3, 6, 7, 10, 13, 22]. W szczególności zastosować może określone kryterium wyboru strategii w grze przeciwko naturze. Jeśli dla przykładu gracz A kierował się będzie kryterium Walda, postaci: max{min VjA (hl ) : l ∈ IH }, j (3.10) wówczas w negocjacjach powienien dążyć do wyboru strategii h1 . Odpowiadająca jej gra pojedyncza h1 ma bowiem dla gracza A największą wartość w sensie kryterium Walda – równą 4, co odpowiada największej z najmniejszych wartości z poszczególnych wierszy macierzy 3.15 równej 4. Jeśli kierował się będzie kryterium Laplace’a postaci: X VjA (hl ) : l ∈ IH }, (3.11) max{max VjA (hl ) : l ∈ IH }, (3.12) max{ j lub kryterium optymistycznym postaci j wówczas równorzędnie ze strategią h1 może rozważać strategię h3 . max Założenie, że gracz B wybierze strategię z minimalną wartością ΥA jl ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 74 POJEDYNCZEJ PRZEZ GRACZA B Zakłada się tu, że gracz B wybierze tę strategię, dla której maksymalny współczynnik do max antagonistycznej odpowiedzi gracza A – ΥA przyjmuje wartość najmniejszą. Przy tym pojl dejściu zakłada się, że gracz B nie znając celu do jakiego dąży gracz A zakłada, że ten grał będzie w sposób antagonistyczny. Rzecz jasna gracz A w sposób prosty może do takiej sytuacji doprowadzić, przekazując graczowi B taką właśnie informację. Przy takim podejściu gracz, do określenia wartości poszczególnych strategii hl gracz A może zastosować następującą metodę. Metoda: 1. Określenie dla każdej z gier hl strategii bj , dla której maksymalny współczynnik do antagonistycznej odpowiedzi gracza A przyjmuje wartość najmniejszą. 2. Określenie skalarnej miary oceny wyniku uzyskanego w rezultacie wyboru strategii bj wyznaczonych w poprzednim ponkcie i strategii ai odpowiadającej rzeczywistemu celowi, do jakiego zmierza gracz A. 3. Wybór strategii hl , dla której wartość skalarnej miary oceny odpowiadającego jej wyniku przyjmuje wartość największą. Przykład 3.14 Rozważmy przykład gry z macierzą wypłat jak w tabeli 3.16. Tabela 3.16: Macierz wypłat w grze podwójnej. h1 h2 a1 a2 a3 b1 [2, 3] [3, 1] [1, 4] b2 [2, 2] [5, 3] b3 [3, 2] [3, 4] h3 a1 a2 a3 a1 a2 a3 b1 [1, 2] [2, 3] [3, 2] b1 [2, 5] [3, 4] [4, 3] [3, 5] b2 [5, 2] [4, 3] [4, 4] b2 [1, 1] [2, 5] [2, 5] [4, 2] b3 [2, 3] [3, 2] [2, 3] b3 [3, 3] [3, 2] [2, 3] 1. Określenie dla każdej z gier hl strategii bj , dla której maksymalny współczynnik do antagonistycznej odpowiedzi gracza A przyjmuje wartość najmniejszą. 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 75 Dla uproszczenia przyjmiemy, że gracz A zakłada10 , że gracz B przyjmuje za miarę zachęty do odpowiedzi w sposób antagonistyczny następującą zależność: max ΥA = jl n o n o, max VjlBmax − VjlBmin , (3.13) max VjlAmax − VjlAmin przy czym VjlBmax oraz VjlAmax są wartościami wypłat odpowiednio gracza B i gracza A w sytuacji, gdy gracz A dąży do celu minimalnie antagonistycznego: n o ăk (bj ) = arg lex max VjA (ai ), −ViB (bj ) , i (3.14) natomiast VjlBmin i VjlAmin wartościami odpowiadającymi wyborowi strategii ai w maksymalny sposób antagonistycznej n o ăk (bj ) = arg lex min ViB (bj ), −VjA (ai ) . i (3.15) Dla macierzy wypłat jak w tabeli 3.13 otrzymujemy: max ΥA = 1. 11 max ΥA = 1. 12 max ΥA = 1. 13 max ΥA = 1/3. 21 max = 1. ΥA 22 max ΥA = 1/4. 23 max ΥA = 1. 31 max ΥA = 1. 32 max ΥA = 1. 33 Z powyższych zależności wynika, że w grze h1 gracz B wybierze strategię b2 i w grze h3 strategię b2 . Niejednoznaczna jest strategia gracza B w grze h2 . Wynika to z faktu, że dla każdej strategii bj wartość współczynnika zachęty do maksymalnie antagonistycznej odpowiedzi gracza A jest jednakowa i wynosi 1. 10 Tego typu arbitralności nie są możliwe do uniknięcia. ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 76 POJEDYNCZEJ PRZEZ GRACZA B W takich przypadkach, dla jednoznacznego wyłonienia strategii bj , gracz A musi zastosować dodaktowe kryterium, którym – jak przypuszcza będzie się kierował gracz B. Jednym z takich kryteriów może być np. dążenie gracza B do wyboru takiej strategii bj , która da mu większą wartość wypłaty11 V B . Rzecz jasna muszą one odpowiadać maksymalnie antagonistyznej odpowiedzi gracza A. Przy takim założeniu, w grze h2 gracz B powinien wybrać strategię b2 , co zapewni mu wypłatę równą 4. 2. Określenie skalarnej miary oceny wyniku uzyskanego w rezultacie wyboru strategii bj wyznaczonych w poprzednim ponkcie i strategii ai odpowiadającej rzeczywistemu celowi, do jakiego zmierza gracz A. Załóżmy dla uproszczenia, iż gracz A w rzeczywistości zmierza do celu indywidualnie efektywnego, a zatem każdy z wyników ocenia zgodnie z poniższą zależnością: V A [V A , V B ] = V A . (3.16) Stąd też gracz A wybierał będzie taką strategię ai , która zapewni mu największą z możliwych wartości wypłaty V(A jl)(ai ). Stąd w grze h1 , w odpowiedzi na strategię b2 gracz A wybierze strategię a3 , co doprowadzi do wyniku [3, 5]; w grze h2 , w odpowiedzi na strategię b2 gracz A wybierze strategię a3 , co doprowadzi do wyniku [4, 4]; w grze h3 w odpowiedzi na strategię b2 gracz A wybierze strategię a2 lub a3 , co doprowadzi do wyniku [2, 5]. 3. Wybór strategii hl , dla której wartość skalarnej miary oceny odpowiadającego jej wyniku przyjmuje wartość największą. Wobec powyższego gra h1 ma dla gracza A wartość równą 5, gra h2 wartość równą 4 i gra h3 wartość równą 5. A zatem w trakcie negocjacji gracz A powinien zabiegać w pierwszej kolejności o wybór strategii h1 lub h3 . Określenie prawdopodobieńst wyboru określonych strategii bj 11 Jest to w istocie założenie, że gracz B dążył będzie nie tylko do wyboru takiej strategii bj , dla której współczynnik do maksymalnie antagonistycznej odpowiedzi będzie jak najmniejszy, ale równocześnie, że gracz B dąży do celu indywidualnie efektywnego. 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 77 Podejście to łączy w sobie zarówno podejście oparte na założeniu, że gracz B traktowany jest jako natura, jak tez podejście oparte na założeniu, że gracz B dąży do wyboru takiej strategii bj , dla której jest minimalne wartość zachęty do antagonistycznej odpowiedzi gracza A. W podejściu traktującym strategie gracza B jak strategie natury, gracz A ignorował wszelkie iformacje na temat macierzy wypłat gracza B, zakładając, że praktycznie każda ze strategii bj może zostać wybrana, co więcej zakładał, że strategie te mogą być wybrane z jednakowym prawdopodobieństwem. W podejściu opierającym się na minimalizacji maksymalnej zachęty do odpowiedzi antagonistycznej, gracz A wskazywał jednoznacznie na strategię bj , którą w danej grze, jego zdaniem gracz B wybierze. W omawianym w tym punkcie podejściu zakładamy, że gracz B wybrać może każdą ze strategii bj (analogia do gry przeciwko naturze), jednakże z prawdopodobieństwem odzwierciedlajacym wartość wypłaty jaką gracz B otrzyma wówczas, gdy gracz A wybierze w odpowiedzi strategię najbardziej antagonistyczną. Przyjmiemy, że dana strategia bj w danej grze hl będzie dla gracza B tym mniej atrakcyjna, im większa będzie suma wartości VjlBmin , czyli wartości wypłaty, jaką otrzyma gracz B wówczas, gdy gracz A w swojej odpowiedzi kieruje się celem maksymalnie antagonistycznym (w pierwszej kolejności minimalizuje wypłatę gracza B, a w przypadku niejednoznaczności maksymalizuje wypłatę własną) oraz VjlBmax , czyli wartości wypłaty, jaką otrzyma gracz B wówczas, gdy gracz A w swojej odpowiedzi kieruje się celem minimalnie antagonistycznym (w pierwszej kolejności maksymalizuje włąsną wypłatę, a w przypadku niejednoznaczności minimalizuje wypłątę gracza B). A zatem prawdopodobieństwo wyboru określonej strategii bj w grze pojedynczej hl wyrazimy następującą zależnością: plj VjlBmin + VjlBmax =P k VklBmin + VklBmax . (3.17) Uwzględniając te prawdopodobieństwa, jak również planowane odpowiedzi ai gracza A na każdą ze strategii bj , określić można wartość oczekiwaną wypłat graczy dla każdej z gier pojedynczych hl zgodnie z zależnościami: E(VlA ) = X plj · VjlA (ai ), (3.18) plj · VilB (bj ). (3.19) j E(VlB ) = X j W ten sposób grę hl opisać można poprzez wynik [E(VlA ), E(VlB )], będący w istocie wartością oczekiwaną z wyników odpowiadających poszczególnym strategiom bj . Następnie dokonać można skalaryzacji tego wyniku w sposób odzwierciedlający cele do jakiego dąży gracz A. V A [E(VlA ), E(VlB )] . (3.20) ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 78 POJEDYNCZEJ PRZEZ GRACZA B Skalaryzacja ta (w sposób analogiczny jak to było dotychczas) określać będzie wartość jaką dany wynik (rozumiany w sensie wartości oczekiwanych z wypłat graczy) ma dla gracza A (w sensie celu, do jakiego zmierza). Wartość skalarnej miary (3.20) określa wartość jaką odpowiadająca jej gra pojedyncza ma dla gracza A. W trakcie negocjacji gracz A powinien dążyć do wyboru tej strategii hl , której odpowiada gra pojedyncza hl o największej wartości. Procedura przebiega więc w sposób następujący: Metoda: 1. Określenie prawdopodobieństw wyboru określonych strategii bj w każdej grze pojedynczej hl zgodnie z zależnością (3.17). 2. Określenie odpowiedzi gracza A (strategii ai ) na każdą ze strategii bj w każdej grze pojedynczej hl . 3. Określenie wartości oczekiwanej wyniku danej gry pojedynczej hl w oparciu o prawdopodobieństwa wyboru określonych strategii bj oraz odpowiedzi gracza A – ai , zgodnie z zależnościami (3.18) i (3.19). 4. Określenie wartości skalarnej miary oceny oczekiwanego wyniku gry pojedynczej hl . 5. Wybór strategii hl , dla której wartość skalarnej miary oceny odpowiadającego jej oczekiwanego wyniku przyjmuje wartość największą. Przykład 3.15 Rozważmy przykład gry z macierzą wypłat jak w tabeli 3.17. Tabela 3.17: Macierz wypłat w grze podwójnej. h1 h2 a1 a2 a3 b1 [2, 3] [3, 1] [1, 4] b2 [2, 2] [5, 3] b3 [3, 2] [3, 4] h3 a1 a2 a3 a1 a2 a3 b1 [1, 2] [2, 3] [3, 2] b1 [2, 5] [3, 4] [4, 3] [3, 5] b2 [5, 2] [4, 3] [4, 4] b2 [1, 1] [2, 5] [2, 5] [4, 2] b3 [2, 3] [3, 2] [2, 3] b3 [3, 3] [3, 2] [2, 3] 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 79 1. Określenie prawdopodobieństw wyboru określonych strategii bj w każdej grze pojedynczej hl zgodnie z zależnością (3.17). Dla określenia prawdopodobieństw wyboru określonych strategii bj w poszczególnych grach pojedynczych hl wyznaczymy najpierw określimy najpierw wartości maksymalnych zachęt do max odpowiedzi antagonistycznych gracza A – ΥA . jl • Gra h1 Bmin Bmax Dla strategii b1 otrzymujemy: V11 = 1, V11 = 1. Bmin Bmax Dla strategii b2 otrzymujemy: V21 = 2, V21 = 3. Bmin Bmax = 3. Dla strategii b3 otrzymujemy: V31 = 3, V31 Stąd otrzymujemy: p11 = 1+1 = 2/13. 1+1+2+3+3+3 2+3 p12 = = 5/13. 13 3+3 p13 = = 6/13. 13 • Gra h2 Bmin Bmax = 2. Dla strategii b1 otrzymujemy: V12 = 1, V12 Bmin Bmax Dla strategii b2 otrzymujemy: V22 = 4, V22 = 4. Bmin Bmax Dla strategii b3 otrzymujemy: V32 = 2, V32 = 2. Stąd otrzymujemy: p21 = 1+2 = 3/15. 1+2+4+4+2+2 4+4 = 8/15. p22 = 15 2+2 p23 = = 4/15. 15 • Gra h3 Bmin Bmax Dla strategii b1 otrzymujemy: V13 = 2, V13 = 2. Bmin Bmax = 1, V23 = 2. Dla strategii b2 otrzymujemy: V23 Bmin Bmax Dla strategii b3 otrzymujemy: V33 = 2, V33 = 2. Stąd otrzymujemy: p31 = 2+2 = 4/11. 2+2+1+2+2+2 ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 80 POJEDYNCZEJ PRZEZ GRACZA B 1+2 = 3/11. 11 2+2 = 4/11. p33 = 11 p32 = 2. Określenie odpowiedzi gracza A (strategii ai ) na każdą ze strategii bj w każdej grze pojedynczej hl . Załóżmy, że gracz A kieruje się celem indywidualnie efektywnym, a zatem: • W grze h1 W odpowiedzi na strategię b1 gracz A wybierze strategię a3 . W efekcie ustali się wynik [1, 4]. W odpowiedzi na strategię b2 gracz A wybierze strategię a3 . W efekcie ustali się wynik [3, 5]. W odpowiedzi na strategię b3 gracz A wybierze strategię a2 . W efekcie ustali się wynik [3, 4]. • W grze h2 W odpowiedzi na strategię b1 gracz A wybierze strategię a2 . W efekcie ustali się wynik [2, 3]. W odpowiedzi na strategię b2 gracz A wybierze strategię a3 . W efekcie ustali się wynik [4, 4]. W odpowiedzi na strategię b3 gracz A wybierze strategię a3 . W efekcie ustali się wynik [2, 3]. • W grze h3 W odpowiedzi na strategię b1 gracz A wybierze strategię a1 . W efekcie ustali się wynik [2, 5]. W odpowiedzi na strategię b2 gracz A wybierze strategię a3 . W efekcie ustali się wynik [2, 5]. W odpowiedzi na strategię b3 gracz A wybierze strategię a1 . W efekcie ustali się wynik [3, 3]. 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 81 3. Określenie wartości oczekiwanej wyniku danej gry pojedynczej hl w oparciu o prawdopodobieństwa wyboru określonych strategii bj oraz odpowiedzi gracza A – ai , zgodnie z zależnościami (3.18) i (3.19). W oparciu o dotychczasowe wyniki otrzymujemy: E(V1A ) = 2/13 · 4 + 5/13 · 5 + 6/13 · 4 = 8/13 + 25/13 + 24/13 = 57/13 = 4.38 E(V2A ) = 3/15 · 3 + 8/15 · 4 + 4/15 · 3 = 9/15 + 32/15 + 12/15 = 53/15 = 3.53 E(V3A ) = 4/11 · 5 + 31 · 5 + 4/11 · 3 = 20/11 + 15/11 + 12/11 = 47/11 = 4.27 E(V1B ) = 2/13 · 1 + 5/13 · 3 + 6/13 · 3 = 2/13 + 15/13 + 18/13 = 35/13 = 2.69 E(V2B ) = 3/15 · 2 + 8/15 · 4 + 4/15 · 2 = 6/15 + 32/15 + 8/15 = 46/15 = 3.07 E(V3B ) = 4/11 · 2 + 31 · 2 + 4/11 · 3 = 8/11 + 6/11 + 7/11 = 21/11 = 1.91 4. Określenie wartości skalarnej miary oceny oczekiwanego wyniku gry pojedynczej hl . Opierając się na założeniu, że gracz A dąży do celu indywidualnie efektywnego, przyjmiemy następującą postać skalarnej miary oceny oczekiwanego wyniku poszczególnych gier pojedynczych: V A [E(VlA ), E(VlB )] = E(VlA ). (3.21) Stąd : V A [E(V1A ), E(V1B )] = E(V1A ) = 4.38 V A [E(V2A ), E(V2B )] = E(V2A ) = 3.53 V A [E(V3A ), E(V3B )] = E(V3A ) = 4.27 5. Wybór strategii hl , dla której wartość skalarnej miary oceny odpowiadającego jej oczekiwanego wyniku przyjmuje wartość największą. Wobec otrzymanych wartości skalarnych miar oceny oczekiwanych wyników gry w trakcie negocjacji gracz A powinien dążyć do wyboru strategii h1 . Założenie indywidualnie efektywnego celu obu graczy ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 82 POJEDYNCZEJ PRZEZ GRACZA B W tym podejściu zakłada się, że gracz B zmierza do celu indywidualnie efektywnego, będąc przekonanym, że gracz A również do niego dąży. Również do tej sytuacji gracz A może doprowadzić przekazując graczowi B informację, iż taki właśnie cel sobie wyznacza. Przyjęcie, że gracz B dążył będzie w tej sytuacji do celu indywidualnie efektywnego podeprzeć można rozumowaniem, że gdyby mimo wszystko, gracz B chciał dążyć do celu antagonistycznego, to mogłoby to zostać odczytane przez gracza A jako prowokacja do gry w ten sposób. Przy takim założeniu, w każdej z gier pojedynczych gracz B powinien wybrać taką strategię bj (oznaczmy ją przez b̂), która zapewni graczowi B możliwie największą wypłatę V B , przy założeniu, że odpowiedzią gracza A będzie taka strategia â(bj ), dla której wartość wypłaty gracza A – V A będzie największa. Powyższe rozumowanie prowadzi do określenia strategii â(bj ) zgodnie z poniższą zależnością: â(bj ) = arg max VjA (ai ) : ∀j, i (3.22) Oznaczmy indeks strategii â(bj ) przez î. Wartość wypłaty gracza B w sytuacji, gdy wybrał on swoją strategię bj , zaś gracz A w odpowiedzi wybrał najlepszą dla siebie strategię â(bj ), oznaczymy przez VîB (bj ). Stąd gracz A może się spodziewać, że w danej grze pojedynczej hl gracz B wybierze taką strategię b̂ dla której zachodzi następująca zależność: b̂ = arg max VîB (bj ). j (3.23) Mając ustaloną strategię b̂ gracz A może określić wynik każdej z gier pojedynczych jako rezultat wyboru strategii b̂ i ostatecznej odpowiedzi gracza A – strategii ai , która w najlepszym sensie odzwierciedlać będzie cel, do którego dąży gracz A (cel ten może, choć nie koniecznie musi odzwierciedlać przyjęty na etapie wyznaczania strategii b̂ cel indywidualnie efektywny). Wartość danej gry pojedynczej hl określona będzie przez wartość skalarnej miary oceny, odzwierciedlającej cel, do jakiego dąży gracz A, wyniku uzyskanego w rezultacie wyboru strategii b̂ i ai . W ostateczności w trakcie negocjacji gracz A powinien zabiegać o wybór w pierwszej kolejności tej strategii hl , dla której odpowiadająca jej gra pojedyncza hl ma dla gracza A wartość największą (w sensie skalarnej miary oceny przewidywanego wyniku, odzwierciedlającej jego cel). O ostateczności przebieg procesu decyzyjnego opisać można w następujących krokach: Metoda: 1. W oparciu o zależności (3.23) i (3.22) określenie strategii b̂, strategii jaką zgodnie z przewidywaniami gracza A wybierze gracz A na etapie gry pojedynczej. 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 83 2. Określenie oczekiwanego wyniku każdej z gier pojedynczych hl – [VĵlA (ai ), VilB (b̂)], jako rezultat wyboru strategii b̂ przez gracza B oraz strategii ai , w najlepszym stopniu odzwierciedlającej cel, do jakiego dąży gracz A. 3. Stworzenie skalarnej miary oceny VlA [VĵlA (ai ), VilB (b̂)] oczekiwanych wyników każdej z gier pojedynczych hl , która odzwierciedlała będzie cel do jakiego dąży gracz A. Wartość tej miary dla danej gry hl określa wartość tej gry. 4. Dążenie do wyboru w trakcie negocjacji tej strategii hl (oznaczmy przez ĥ), dla której odpowiadająca jej gra pojedyncza posiada największą wartość. ĥ = arg max VlA [VĵlA (ai ), VilB (b̂)] . (3.24) l Przykład 3.16 Rozważmy przykład gry z macierzą wypłat jak w tabeli 3.18. Tabela 3.18: Macierz wypłat w grze podwójnej. h1 h2 a1 a2 a3 b1 [2, 3] [3, 1] [1, 4] b2 [2, 2] [5, 3] b3 [3, 2] [3, 4] h3 a1 a2 a3 a1 a2 a3 b1 [1, 2] [2, 3] [3, 2] b1 [2, 5] [3, 4] [4, 3] [3, 5] b2 [5, 2] [4, 3] [4, 4] b2 [1, 1] [2, 5] [2, 5] [4, 2] b3 [2, 3] [3, 2] [2, 3] b3 [3, 3] [3, 2] [2, 3] 1. W oparciu o zależności (3.23) i (3.22) określenie strategii b̂, strategii jaką zgodnie z przewidywaniami gracza A wybierze gracz A na etapie gry pojedynczej. Prześledźmy sposób rozumowania gracza B przy założeniu, że dąży on do celu indywidualnie efektywnego i spodziewa się indywidualnie efektywnej odpowiedzi gracza A. • Gra h1 Jeśli gracz B wybrałby strategię b1 , wówczas odpowiedzią gracza A byłaby strategia a3 i ustaliłby się wynik [1, 4]. Jeśli gracz B wybrałby strategię b2 , wówczas odpowiedzią gracza ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 84 POJEDYNCZEJ PRZEZ GRACZA B A byłaby strategia a3 i ustaliłby się wynik [3, 5]. Jeśli gracz B wybrałby strategię b3 , wówczas odpowiedzią gracza A byłaby strategia a2 i ustaliłby się wynik [3, 4]. Wobec powyższego w grze h1 gracz B wybierze strategię b2 12 . • Gra h2 Jeśli gracz B wybrałby strategię b1 , wówczas odpowiedzią gracza A byłaby strategia a2 i ustaliłby się wynik [2, 3]. Jeśli gracz B wybrałby strategię b2 , wówczas odpowiedzią gracza A byłaby strategia a3 i ustaliłby się wynik [4, 4]. Jeśli gracz B wybrałby strategię b3 , wówczas odpowiedzią gracza A byłaby strategia a1 lub a3 i ustaliłby się wynik [2, 3]. Wobec powyższego w grze h2 gracz B wybierze strategię b2 . • Gra h3 Jeśli gracz B wybrałby strategię b1 , wówczas odpowiedzią gracza A byłaby strategia a1 i ustaliłby się wynik [2, 5]. Jeśli gracz B wybrałby strategię b2 , wówczas odpowiedzią gracza A byłaby strategia a2 lub a3 i ustaliłby się wynik [2, 5]. Jeśli gracz B wybrałby strategię b3 , wówczas odpowiedzią gracza A byłaby strategia a1 lub a3 i ustaliłby się wynik [3, 3] lub [2, 3]13 . Którą ze strategii wybierze tu gracz B? Wybór strategii b3 daje z jednej strony graczowi B nadzieję, że gracz A odpowie indywidualnie efektywną strategią a1 , co doprowadziłoby do korzystnego dla gracza B wyniku [3, 3]. Taka odpowiedź jest jednakże mało prawdopodobna i to nie tylko dlatego, że gracz A będzie miał dostępną tak samo dla siebie dobrą (z punktu indywidualnie efektywnego celu) strategię a3 , ale również dlatego, że wybór strategii b3 może zostać przez niego potraktowany jako antagonistyczne posunięcie ze strony gracza B. W istocie bowiem wybór strategii b1 lub b2 , dawałby graczowi B taką samą wartość wypłaty, jak w przypadku wyboru strategii b3 i odpowiedzi a3 . Mimo wszystko gracz B nie musi się tu obawiać antagonizmu gracza A. Wszystko, co w przypadku wyboru strategii b3 może zrobić gracz A, to wybrać strategię a3 , doprowadzając w ten sposób do 12 Strategia b3 dawałaby graczowi B taką samą wartość wypłaty, jednakże gorszą graczowi A. Przy uwzględ- nieniu przyjętych tu założeń należy oczekiwać, że gracz B obawiał się będzie wyboru strategii b3 (minimalnie antagonistycznej), bowiem ta mogłaby zostać odebrana przez gracza A jako prowokacja do równie, albo jeszcze bardziej antagonistycznej odpowiedzi, co z punktu indywidualnie efektywnego celu gracza B nie byłoby korzystne. 13 Z racji na fakt, że gracz A wykonuje ruch jako drugi, to nie musi się obawiać wyboru strategii minimalnie antagonistycznej a3 , co da mu taki sam wynik jak w przypadku strategii a1 , natomiast gorszy dla gracza B. 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 85 wyniku [2, 3], co i tak może się graczowi B wydać rozwiązaniem bardziej atrakcyjnym14 , niż doprowadzenie do wyniku [2, 5], jakby to było w przypadku wyboru strategii b1 lub b2 . Ostateczna decyzja gracza B nie jest tu więc oczywista. Gracze we wzajemnym porozumieniu mogą dojść do określenia, który z wyników zostanie ustalony [2, 5], [2, 3] czy może [3, 3]. Ogromną rolę w dokonywaniu tego wyboru odgrywać mogą przewidywane stosunki w przyszłości. Dla uproszczenia analizy przyjmimy jednakże, iż gracz A przyjmuje wersję najbardziej pesymistyczną oczekując wyboru strategii b3 . Podsumowując, otrzymamy: b̂1 = b2 . b̂2 = b2 . b̂2 = b3 . 2. Określenie oczekiwanego wyniku każdej z gier pojedynczych hl – [VĵlA (ai ), VilB (b̂)], jako rezultat wyboru strategii b̂ przez gracza B oraz strategii ai , w najlepszym stopniu odzwierciedlającej cel, do jakiego dąży gracz A. Przyjmimy, iż gracz A rzeczywiście dąży do celu indywidualnie efektywnego. Wobec tego w grze h1 , gracz A na strategię b2 odpowie strategią a3 , co da wynik [V1A , V1B )] = [3, 5], w grze h2 , gracz A na strategię b2 odpowie strategią a3 , co da wynik [V2A , V2B )] = [4, 4], w grze h3 , gracz A na strategię b3 odpowie strategią a1 , co da wynik [V3A , V3B )] = [3, 3]. 3. Stworzenie skalarnej miary oceny VlA [VĵlA (ai ), VilB (b̂)] oczekiwanych wyników każdej z gier pojedynczych hl , która odzwierciedlała będzie cel do jakiego dąży gracz A. Wartość tej miary dla danej gry hl określa wartość tej gry. Przyjmiemy, iż gracz A, w świetle indywidualnie efektywnego celu, do którego dąży, oceniał będzie poszczególne wyniki, a poprzez to określał będzie wartość poszczególnych gier pojedynczych zgodnie z poniższą formułą. V A [V A , V B ] = V A . Stąd gra h1 ma dla gracza A wartość V A [3, 5] (3.25) = 5, gra h2 ma dla gracza B wartość V A [4, 4] = 4, gra h3 ma dla gracza B wartość V A [3, 3] = 3. 14 Pamiętać należy, iż dążenie do celu indywidualnie efektywnego przez gracza B może być podyktowane jedynie obawą przed antagonistyczną odpowiedzią gracza A, w rzeczywistości zaś gracz B może szykać nie kosztownych dla siebie sposobów osłabienia wyniku osiąganego przez gracza A. ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 86 POJEDYNCZEJ PRZEZ GRACZA B 4. Dążenie do wyboru w trakcie negocjacji tej strategii hl (oznaczmy przez ĥ), dla której odpowiadająca jej gra pojedyncza posiada największą wartość. W trakcie negocjacji gracz A powinien zatem dążyć do wyboru strategii ĥ = h1 . Przedstawione wyżej metody podejścia do problemu wyboru strategii hl , w sytuacji nieznajomości celu, do jakiego dąży gracz B, a więc: • Potraktowanie każdej z gier pojedynczych jako gry przeciwko naturze max • Założenie, że gracz B wybierze strategię z minimalną wartością ΥA jl • Określenie prawdopodobieńst wyboru określonych strategii bj • Założenie indywidualnie efektywnego celu obu graczy traktować można jako wzajemne uzupełnienie. W szczególności, jeśli określona metoda wskazuje niejednoznacznie na dwie strategie hl , wówczas do wyłonienia jednej z nich gracz A może zastosować inną metodę. Gracz A może również przyjąć, że zdecyduje się na wybór tej strategii, na którą wskaże najwięcej z powyższych metod. W istocie każda z metod pozwoli na uszeregowanie poszczególnych strategii hl , wskazując na strategie w jej sensie najbardziej pożądane, aż do strategii najmniej pożądanych. Opierając swój wybór na kilku metodach gracz A będzie w istocie musiał dokonać agregacji ocen otrzymanych z poszczególnych metod. Sam zaś proces agregacji traktować można jako stworzenie nowej medoty oceny wartości poszczególnych strategii hl 15 . Wymiana informacji na temat celu graczy Z punktu widzenia gry pojedynczej przed graczem A, zaś z punktu widzenia gry podwójnej przed oba graczami stoi więc wyzwanie, czy przekazywać sobie wzajemnie informację na temat celu, do jakiego gracze zmierzają, czy też raczej zachować tę informację dla siebie. W szczególnych przypadkach przekazanie tej informacji może stanowić swoiste „powiększenie ciastka” [2, 14, 16, 18], zanim gracze poprzez wybór konkretnych strategii dokonają pomiędzy siebie jego podziału. Problem dla danego gracza polega jednak na tym, że w owym „większym ciastku” przypaść mu może mniejsza część, niż pierwotnie [19]. Rzecz jasna gracze nigdy nie stracą na tym, że poznają cel drugiego gracza. Stąd też w interesie graczy będzie próba pozyskania informacji na temat 15 Agregacja wielokryterialnych ocen wielu wariantów jest problemem analogicznym do próby wyłaniania naj- lepszego z pośród wielu wariantów w drodze głosowania, w którym udział bierze wielu członków (wiele kryteriów oceny) [12, 14, 20]. 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 87 celu, do jakiego drugi gracz zmierza. Źródłem straty może być jedynie przekazanie drugiemu graczowi informacji na temat celu, do jakiego samemu się zmierza. Jednakże, jak to zostało wykazane w przykładzie 3.6 to samo przekazanie informacji może stanowić dla gracza źródło zysku. Rozważając problem z punktu widzenia gracza A istotną więc jest odpowiedź na dwa pytania: 1. Jakiego zysku można się spodziewać z pozyskania informacji na temat celu, do jakiego będzie dążył gracz B (w szczególności z pozyskania informacji na temat strategii jaką wybierze)? 2. Jakiego zysku/straty można się spodziewać z przekazania graczowi B informacji na temat celu, do jakiego dąży gracz A? Odpowiedź na pytanie pierwsze pozwala oszacować maksymalny koszt, jaki opłaca się ponieść na pozyskanie informacji o celu gracza B. Odpowiedź na pytanie drugie pozwala oszacować minimalna cenę, za którą opłacałoby się informację o własnym celu graczowi B sprzedać. Rzecz jasna oba problemy są ze sobą powiązane. Jeśli gracz B nie zna celu do jakiego dąży gracz A, to pozyskanie przez gracza A informacji na temat celu, do jakiego dąży gracz B może nie przynieść wiele korzyści w kwestii określenia, która ze strategii bj zostanie przez gracza B wybrana. Jeśli gracz B znał będzie cel do jakiego dąży gracz A, wówczas graczowi wystarczy dowiedzieć się do jakiego celu dążył będzie gracz B, a określenie konkretnej strategii bj będzie już można wywnioskować. Poznanie celu, do jakiego dąży gracz B, nawet w sytuacji, gdy gracz B nie zna celu do jakiego dąży gracz A jest o tyle dla gracza A korzystne, że umożliwia mu to odpowiednie „sterowanie” decyzją gracza B poprzez wysuwanie deklaracji gry w określony sposób, w tym składanie obietnic i wysuwanie gróźb, w kontekście danej strategii bj gracza B. Należy się jednak liczyć z tym, że próba wpływania na decyzję gracza B (w szczególności poprzez wysuwanie gróźb) może spowodować zmianę celu, do jakiego dążył będzie gracz B. Innymi słowy, gracz A próbując sterować decyzją gracza B poprzez selektywne przekazywanie informacji na temat planowanych własnych odpowiedzi na określone strategie gracza B w istocie oddaje możliwość wyboru wyniku gry w ręce gracza B. Jeśli tylko składane deklaracje określonych odpowiedzi ai (bj ) będą wiarygodne, wówczas gracz B może sam zadecydować, jaki ustalić wynik gry, poprzez wybór określonej strategii bj , na którą gracz A zobowiązał się odpowiedzieć strategię ai (bj ). W istocie bowiem cel do jakiego zamierzał dążyć gracz B mógłbyć uwarunkowany głównie niepewnością związaną z potencjalną odpowiedzią (a więc i celem) gracza A. Poznanie tych odpowiedzi uwalnia gracza B z tych uwarunkowań tak, że może on już swobodniej kształtować cel, do którego chce zmierzać, mając odwagę wyboru określonych strategii bj , na które już z góry zna odpowiedź gracza A. ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 88 POJEDYNCZEJ PRZEZ GRACZA B A zatem przed graczem A stoi jeszcze jeden problem: stabilność celu gracza B w kontekście wysuwanych gróźb i obietnic ze strony gracza A. Aby określić wartość informacji na temat celu do jakiego dąży gracz B należałoby dokonać dwóch kalkulacji: kalkulacji wyniku jakiego spodziewa się gracz A w przypadku nieznajomości celu gracza B oraz kalkulacji wyniku, jaki przypuszczalnie ustalić by się miał w sytuacji znajomości tegoż celu. Moduł różnicy wartości skalarnych miar wartości tych wyników, odzwierciedlających cel gracza A przyjąć by można wówczas za definicję wartości informacji dotyczącej celu gracza B. W sensie formalnym brzmi to prosto, w praktyce jednak prostota dotyczy jedynie owego brzmienia16 . Dwie z wyżej opisanych metod wyboru strategii hl w kontekście nieznajomości celu, do jakiego dążył będzie gracz B: max • Założenie, że gracz B wybierze strategię z minimalną wartością ΥA jl • Założenie indywidualnie efektywnego celu obu graczy w istocie sprowadzają się do założenia, że gracz B w swojej decyzji kierował się będzie określonym, znanym dla gracza A celem, co więcej zakłada znajomość określonej strategii bj , jaką w danej grze pojedynczej hl gracz B wybierze. Aby oszacować wynik, jaki ustali się wówczas, gdy gracz A rzeczywiście pozna cel gracza B, po to, by określić wartość pozyskanej informacji, należałoby uprzednio przyjąć znajomość tego celu. Przy założeniu, że w sytuacji nieznajomości celu gracza B gracz A decyduje się na wybór jednej z powyższych metod, trudno znaleźć uzasadnienie, dlaczego do szacowania wyniku określonego przez rzeczywisty cel gracza B do jego wyznaczenia zakłada się cel inny, niż założony w powyższych metodach. Gdyby tak być miało, należałoby w punkcie wyjścia – w momencie kształtowania metody wyboru strategii hl w sytuacji nieznajomości celu gracza B – założyć, że ten cel jest właśnie taki, jak to się następnie zamierza przyjąć w momencie szacowania wyniku, odpowiadającego rzeczywistemu celowi. Sama więc koncepcja zdaje się nie wytrzymywać krytyki na gruncie teoretycznym. Analogicznie rzecz by się miała w przypadku, gdy do wyboru strategii hl w kontekście nieznajomości celu, do jakiego dąży gracz B, przyjmie się którąś z pozostałych metod: • Potraktowanie każdej z gier pojedynczych jako gry przeciwko naturze • Określenie prawdopodobieńst wyboru określonych strategii bj 16 Przeprowadzany w tym miejscu wywód jest próbą nawiązania do koncepcji operatora najbardziej obiecu- jącego, wykorzystanej do oszacowania zysku z pozyskania informacji na temat macierzy wypłat gracza konkurencyjnego w grach przeciwko naturze [6, 8, 10]. 3.1. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES NEGOCJACJI STAWEK ROZLICZENIOWYCH NA RYNKU HURTOWYM – H 89 W przypadku wyboru metody, w której każdą z gier pojedynczych traktuje się, jako swoistą grę przeciwko naturze, w istocie postanawia się przyjąć, iż każda ze strategii bj jest tak samo możliwa do wyboru przez gracza B (jednakowe prawdopodobieństwo). Skoro taka metoda została wybrana do oszacowania wartości danej gry pojedynczej, to trudno jest znaleźć uzasadnienie, dlaczego do oszacowania tej wartości w przypadku znajomości rzeczywistego celu gracza B przyjąć metodę inną. Jeśli próbując oszacować a priori wartość informacji dotyczącej celu gracza B postanawia się przyjąć okreśoną strategię bj (ewentualnie ich zbiór), jako odzwierciedlającą ten cel, to niniejszym stwierdza się, że wszystkie strategie bj nie są tak samo prawdopodobne, a więc przyjęta metoda szacowania wartości gry pojedynczej musiałaby się okazać w punkcie wyjścia błędna. Podobnie rzecz się mieć będzie w przypadku metody polegającej na określeniu prawdopodobieńst wyboru określonych strategii bj . Jeśli na etapie szacowania wartości gry pojedynczej przy założeniu znanego a priori celu gracza B przyjąć inne wartości prawdopodobieńst (choćby przez wskazanie konkretnej strategii bj , którą gracz B miałby wybrać) tym samym podważa się słuszność pierwotnie przyjętych wartości prawdopodobieńst. Wobec powyższego należy stwierdzić, że próba określenie korzyści z pozyskania informacji na temat rzeczywistego celu gracza B, czyli próba przekształcenia omawianej w tym rozdziale gry z nieznanym celem w omawianą w rozdziale poprzedniem grę ze znanym celem gracza B, musi prowadzić nieuchronnie albo do stwierdzenia braku korzyści z pozyskania takiej informacji (zarówno w przypadku nieznajomości celu jak i w przypadku jego znajomości gracz A wskazywałby albo na tę samą strategię bj , jaką gracz B miałby wybrać, albo na ten sam rozkład prawdopodobieństwa wyboru poszczególnych strategii bj ), albo do podważenia słuszności przyjętej metody szacowania wartości gry pojedynczej, co po jej skorygowaniu prowadziłoby i tak do stwierdzenia, że pozyskanie informacji nie niesie żadnej korzyści. Jeśli więc tylko w powyższym rozumowaniu nie ma błędu, to musimy stwierdzić, iż gracz A nie jest w stanie oszacować a priori wartości informacji na temat celu do jakiego zmierzał będzie gracz B. Do rozważenia pozostaje więc jeszcze problem ewentualnej korzyści lub straty z przekazania graczowi B informacji na temat własnego celu. Jak to stwierdzono wcześniej takie posunięcie może być sensowne z punktu widzenia gracza A jedynie wówczas, gdy sam zna już cel do jakiego dąży gracz B. Jak to ilustrowały omawiane wyżej przykłady (od 3.4 do 3.8) wielkość korzyści zależna jest tak zarówno od celu do jakiego dąży gracz B, jak też od samej struktury macierzy wypłat. Wielkość ewentualnej korzyści lub straty, przy założeniu znajomości celu gracza B gracz A może w tym wypadku określić w sposób jednoznaczny, jeśli pewnym będzie, że gracz B swego celu nie zmieni oraz za wiarygodną (czy też niewiarygodną, jak to ilustrowano w przykładzie 3.7) ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 90 POJEDYNCZEJ PRZEZ GRACZA B uzna deklarację gry w określony sposób przez gracza A. Rzecz jasna, jeśli przekazanie informacji graczowi B na temat rzeczywistego celu gracza A miałoby być dla gracza niekorzystne, wówczas w jego interesie jest zachowanie tego celu w tajemnicy, a może jeszcze bardziej przekazanie informacji o celu nieprawdziwym, który jeśli zostanie przez gracza B uznany za prawdziwy, może doprowadzić do najlepszej realizacji prawdziwego celu gracza A (przykład tego omówiony został w punkcie dotyczącym antagonistycznej korzyści gracza A z niewiarygodnej deklaracji gry w sposób indywidualnie efektywny). 3.2 Pierwszym ruchem w grze podwójnej jest proces ustalania cen na rynku detalicznym gracza A Przypadek, w którym w grze podwójnej pierwszym ruchem jest proces ustalania cen na rynku detalicznym gracza A jest o tyle dla tego gracza trudnym, że na drodze do określenia wartości poszczególnych gier pojedynczych ai , uzyskanych w rezultacie wyboru w grze podwójnej określonej strategii ai , gracz A napotyka dwa źródła niepewności: 1. Niepewność odnośnie strategii bj na rynku detalicznym gracza B 2. Niepewność odnośnie strategii hl , jako wynik negocjacji cen na rynku hurtowym (ruch hipotetycznego gracza H) Obie niepewności wynikają z nieznajomości celu do jakiego dąży gracz B. Do rozwiązania problemu decyzyjnego z punktu widzenia gry podwójnej – wyboru takiej strategii ai , która doprowadzi do najkorzystniejszej z punktu widzenia gracza A gry pojedynczej – gracz A może zastosować jedno z poniższych podejść. Założenie, że w trakcie negocjacji H zostanie wybrana strategia rekomendowana przez regulatora Jest to podejście najprostsze, umożliwiające graczowi A wyeliminowanie niepewności związanej z wyborem w trakcie negocjacji określonej strateii hl . Gracz A zakłada tu, iż w trakcie odbywających się w grze pojedynczej negocjacji H zostanie wybrana strategia rekomendowana przez regulatora h∗ . Przy takim założeniu z punktu widzenia gry podwójnej gracz A może analizować przypadek AHB tak samo jak omawiany we wcześniejszym punkcie tego rozdziału przypadek HAB, zaś przypadek ABH tak samo jak przypadek HBA. Wymaga to jedynie założenia, że w grze pojedynczej gracz A ma tylko jedną dostępną strategię ai , która odpowiada założonej strategii h∗ . 3.2. PIERWSZYM RUCHEM W GRZE PODWÓJNEJ JEST PROCES USTALANIA CEN NA RYNKU DETALICZNYM GRACZA A 91 Założenie określonego celu gracza B Jest to w istocie próba przekształcenia problemu decyzyjnego gracza A do przypadku omawianego w poprzednim rozdziale, w którym założono znajomość celu do jakiego dąży gracz B. W istocie rzeczy, w wielu przypadkach może się to okazać nie aż takie trudne. W szczególności spodziewać się można, iż największe zainteresowanie gracza B wzbudzać będzie cel indywidualnie efektywny lub minimalnie antagonistyczny. Podpowiedzią dla gracza A w tym względzie mogą być wartości maksymalnych współczynników antagonistycznej zachęty do wyboru określonej strategii. Jeśli będą one nie duże, to gra w sposób antagonistyczny może się okazać dla gracza B zbyt kosztowna, a więc dobrym przybliżeniem będzie założenie, że gracz ten w sposób antagonistyczny grać się nie zdecyduje. ROZDZIAŁ 3. USTALONA KOLEJNOŚĆ RUCHÓW – GRACZ A NIE ZNA SPOSÓBU ROZEGRANIA GRY 92 POJEDYNCZEJ PRZEZ GRACZA B Rozdział 4 Możliwość kształtowania kolejności ruchów w grze podwójnej Przedstawiony w dwóch poprzednich rozdziałach problem decyzyjny gracza A sprowadał się do kwestii wyboru określonej strategii gry w grze podwójnej. Zakładaliśmy tam istotnie, że to właśnie gracz A wykonuje ruch w grze podwójnej. Tak ukształtowana sytuacja decyzyjna jest jednak w rzeczywistości wynikiem dokonania uprzedniego wyboru: podjęcia decyzji wykonywania w całej grze ruchu jako pierwszy. Ponadto zakładano, że również w grze pojedynczej kolejność ruchów graczy jest ustalona. Dopuszczając możliwość kształtowania przez graczy kolejności ruchów w grze podwójnej (jak też w grze pojedynczej) stawiamy graczy przed podwójnym problemem: raz, problemem oszacowania wartości poszczególnych uszeregowań ruchów graczy, w szczególności wskazania uszeregowania dla danego gracza najbardziej korzystnego, dwa, problemem wdrożenia najbardziej pożądanej kolejności. W niniejszym rozdziale nasza uwaga zostanie skupiona na problemie pierwszym, problemie oszacowania wartości poszczególnych uszeregowań ruchów graczy. Problem wdrożenia najbardziej pożądanej dla danego gracza kolejności ruchów traktować należy przede wszystkim jako problem praktyczny, którego teoretyczna analiza wybiega poza zakres niniejszego pracy. A zatem z punktu widzenia gry podwójnej stawiamy przed graczem A (jak również przed graczem B) problem wskazania najbardziej pożądanej z jego punktu widzenia kolejności ruchów. W szczególności pytamy, czy opłaca się graczowi A jako pierwszemu ustalać ceny na własnym rynku detalicznym (proces A) czy może raczej poczekać, aż ceny te ustali gracz B, lub też hipotetyczny gracz H, którego strategie odzwierciedlają możliwe wyniki procesu negocjacji cen na rynku hurtowym. Wartość danego uszeregowania dla gracza A (jak też dla gracza B) określić można poprzez 93 94 ROZDZIAŁ 4. MOŻLIWOŚĆ KSZTAŁTOWANIA KOLEJNOŚCI RUCHÓW W GRZE PODWÓJNEJ wynik, jakiego w wyniku całej gry (podwójnej i pojedynczej) gracze mogą się spodziewać (czy to w sensie dosłownym, czy też w sensie probabilistycznym, w sensie wartości oczekiwanej). Przed graczami stoi więc problem oszacowania wartości poszczególnych gier pojedycznych, do jaki dojść może w rezultacie wyboru określonej strategii w grze podwójnej. Gracze więc pytają o wartość każdego z sześciu uszeregowań: ABH, AHB, HBA, HAB, BAH oraz BHA. Należy zauważyć, że przynajmniej w sensie teoretycznym decyzja danego gracza odnośnie pożądanej kolejności ruchów nie może się ograniczać do wskazania, kto z punktu widzenia jego korzyści powinien wykonać ruch jako pierwszy w grze podwójnej. Istotna bowiem może się okazać również kolejność ruchów w grze pojedynczej. Oznaczmy przez V A (AHB) wartość, jaką dla gracza A ma uszeregowanie AHB. Jeśli możliwą jest sytuacja, że: V A (AHB) > V A (HAB) > V A (ABH) > V A (HBA) to widać wyraźnie, iż gracz A nie może jednoznacznie stwierdzić, że korzystniej dla niego jest ustalić w grze podwójnej ceny na rynku detalicznym, aniżeli ceny na rynku hurtowym. To bowiem, który z ruchów będzie bardziej preferowany w trakcie rozgrywania gry podwójnej zależne jest od tego, jaka będzie kolejność ruchów w grze pojedynczej. Stąd też rodzi się wniosek, iż zabiegając o to, by dany gracz wykonał ruch jako pierwszy w grze podwójnej, gracz A (jak również gracz B) musi rozważać, że istnieje szansa, że uda mu się również w grze pojedynczej ukształtować pożądaną kolejność ruchów. Omowione w dwóch poprzednich rozdziałach metody umożliwiają graczowi A oszacowanie wartości czterech z pośród sześciu uszeregowań: ABH, AHB, HBA, HAB. Są to uszeregowania, w których zakładaliśmy, że gracz A wykonuje w grze podwójnej ruch jako pierwszy (czy to w sensie niezależnej decyzji odnośnie własnych cen na rynku detalicznym, czy też w sensie możliwości wpływania na wynik procesu negocjacji cen na rynku hurtowym). Uszeregowania BAH i BHA uznane zostały z punktu widzenia gracza A za gry pojedyncze, bowiem faktycznie udział w grze dla gracza A rozpoczyna się tutaj dopiero po niezależnej decyzji gracza B. Dążąc do wskazania optymalnej kolejności ruchów gracz A musi w jakiś sposób ocenić wartość również i tych uszeregowań. Aby tego dokonać gracz A musi określić, którą strategię bj (ewentualne które ze strategii) w grze podwójnej gracz B może wybrać, jak również określić wartość ukształtowanej w ten sposób gry pojedynczej bj . Wybór określonej strategii bj zależna jest od tego, jaką wartość dla gracza B posiada gra pojedyncza bj . Rozwiązanie tego problemu jest dość proste w przypadku, gdy gracz A zna cel do jakiego dąży gracz B. W tym przypadku gracz A może potraktowąć przypadek BHA tak jak omawiany w rozdziale 2 przypadek AHB, zaś przypadek BAH jak przypadek ABH wcielając się w ten sposób w pierwotnych przypadkach (BHA i BAH) w rolę gracza B, traktując 95 jego macierz wypłat jako własną, zaś własną jako jego. W zależności od tego, czy w pierwotnym problemie (BHA i BAH) gracz B znał cel gracza A czy nie, w problemie przekształconym (AHB i ABH) gracz A powinien założyć, że zna lub nie cel gracza B. Zilustrujemy to na poniższym przykładzie. Przykład 4.1 Załóżmy, że gracz A chce oszacować wartość uszeregowania BHA. Macierz wypłat w grze przedstawia się jak w tabeli 4.1. Tabela 4.1: Macierz wypłat w grze pierwotnej. b1 b2 a1 a2 a3 h1 [2, 3] [3, 1] [1, 4] h2 [2, 2] [5, 3] h3 [3, 2] [3, 4] b3 a1 a2 a3 a1 a2 a3 b1 [1, 2] [2, 3] [3, 2] b1 [2, 5] [3, 4] [4, 3] [3, 5] b2 [5, 2] [4, 3] [4, 4] b2 [1, 1] [2, 5] [2, 5] [4, 2] b3 [2, 3] [3, 2] [2, 3] b3 [3, 3] [3, 2] [2, 3] Aby określić wartość tego uszeregowania V A (BHA) gracz A musi określić przewidywany wynik całej gry (choćby w sensie wartości oczekiwanej wyniku) – [V A , V B ]. Załóżmy, że gracz A zna cel do jakiego dąży gracz B. Gracz B jednakże nie zna celu, do jakiego dąży gracz A. Dla oszacowania wyniku tej gry, gracz A przekształca ten przypadek w przypadek AHB, z założeniem, że w tym nowym przypadku gracz A nie zna już celu gracza B 1 . Macierz wypłat w grze przekształcownej przedstawia się jak w tabelii 4.2. Tabela 4.2: Macierz wypłat w grze przekształconej. a1 1 a2 b1 b2 b3 h1 [2, 3] [3, 1] [1, 4] h2 [2, 2] [5, 3] h3 [3, 2] [3, 4] a3 b1 b2 b3 b1 b2 b3 h1 [1, 2] [2, 3] [3, 2] h1 [2, 5] [3, 4] [4, 3] [3, 5] h2 [5, 2] [4, 3] [4, 4] h2 [1, 1] [2, 5] [2, 5] [4, 2] h3 [2, 3] [3, 2] [2, 3] h3 [3, 3] [3, 2] [2, 3] Wynika to z faktu, że w przypadku pierwotnym gracza B nie znał celu graca A. 96 ROZDZIAŁ 4. MOŻLIWOŚĆ KSZTAŁTOWANIA KOLEJNOŚCI RUCHÓW W GRZE PODWÓJNEJ Przypadek ten analizować już możemy w oparciu o narzędzia przedstawione w rozdziale 3, dotyczące przypadku gdy w grze podwójnej pierwszym ruchem jest ustalenie cen na rynku detalicznym gracza A. Aby określić wartość danego uszeregowania gracz A dokonuje skalaryzacji uzyskanego wyniku. Należy zwrócić uwagę, że owa skalaryzacja dokonywać się winna na wartości wypłaty z macierzy pierwotnej, nie zaś przekształconej. Innymi słowy, jeśli w macierzy przekształconej ukształtował się wynik [V A = 2, V B = 3], to w macierzy pierwotnej oznacza on [V B = 2, V A = 3] i ten wynik należy ostatecznie poddawać ocenie. W przypadku, gdy gracz A nie zna celu do jakiego dążył będzie gracz B, wówczas nie jest w stanie przewidzieć, którą ze strategii bj gracz ten wybierze w trakcie rozgrywania gry podwójnej. W tej sytuacji jednym z możliwych sposobów, pozwalającym graczowi A oszacować wartość uszeregowania, w którym pierwszym ruchem jest proces B, będzie potraktowanie decyzji gracza B, jako decyzji natury. Wartość poszczególnych gier pojedynczych bj może gracz A oszacować w sposób jednoznaczny, jeśli przyjmie, że w trakcie przeprowadzanych w grze pojedynczej negocjacji zostanie wybrana strategia h∗ lub probabilistyczny, jeśli dopuści wybór innej strategii hl . Wynik całej gry (gry podwójnej) określony więc zostanie poprzez dobór odpowiedniego kryterium wyboru strategii w grze przeciwko naturze, agregującego wartości poszczególnych gier pojedynczych w sposób odzwierciedlający stosunek gracza A do niepewności związanej z decyzją gracza B. Zakończenie W ramach zakończenia podsumowane zostaną podstawowe rezultaty pracy oraz nakreślone kierunki dalszych badań. Rezultaty pracy są następujące: • Dokonano analizy zależności pomiędzy ustaloną a pożądaną kolejnością ruchów w grze pojedynczej. Analizowano problem, czy korzystnie dla danego gracza jest dokonywać takiego wyboru w grze podwójnej, który przy ustalonej kolejności ruchóww grze pojedynczej ukształtuje macierz wypłat tej gry jako gry z preferencją kolejności ruchów odpowiadającej kolejności ustalonej. W oparciu o różne przypadki szczególne wykazano, że może zachodzić sytuacja, w której korzystnie dla danego gracza będzie ukształtować daną grę pojedynczą jako grę z preferencją kolejności ruchów niezgodnej z kolejnością ruchów (np. opłaca się graczowi A, który w grze pojedynczej musi ruszać się jako pierwszy ukształtować tę grę jako grę z preferencją drugiego). • Zaproponowano narzędzia ułatwiające danemu graczowi podjęcie decyzji odnośnie wyboru określonej strategii gry w grze podwójnej dla różnych wariantów kolejności ruchów graczy, z uwzględnieniem znajomości bądź nieznajomości celu, do jakiego w swych decyzjach dążył będzie drugi gracz. • Zaproponowano metodę określania pożądanej kolejności ruchów graczy. • W ramach szczegółowych osiągnięć pracy należy wymienić: – Wyrażenie za pośrednictwem zależności matematycznych indywidualnie efektywnego, jak też różnych antagonistycznych celów graczy. – Nakreślenie różnicy oraz wzajemnych zależności pomiędzy celem antagonistycznym, a celem złośliwym. – Wykazanie ograniczonej skuteczności, a w szczególnym przypadku wręcz odwrotnych skutków wysuwania gróźb gry w sposób antagonistyczny w przypadku nieznajomości celu do jakiego dąży drugi gracz. 97 98 DODATEK . ZAKOŃCZENIE – Odkrycie przypadku, w którym niewiarygodność gracza może stać się jego silnym atrybutem w kontekście realizacji określonego celu. – Wskazanie na zmianę znaczenia pojęcia „efektywność”, a co się z tym wiąże na niebezpieczeństwo dokonywania zewnętrznych regulacji w przypadku, gdy gracze dążą do antagonistycznych celów. Analiza gier podwójnych, w których gracze mogą stosować strategie antagonistyczne stanowi w istocie łącznik pomiędzy jednokryterialnymi grami dwuosobowymi, a wielokryterialnymi grami wieloosobowymi. Ów łącznik stanowi w istocie wstęp, realizację pierwszych zrębów analizy tych ostatnich. Z racji na bogactwo zagadnienia i skalę skomplikowania problemu analiza gier wieloosobowych i wielokryterialnych stanowi w dalszym ciągu wyzwanie i zaproszenie do podjęcia dalszych studiów nad tym tematem. Bibliografia [1] Roger Dawson. Sekrety udanych negocjacji. Wydawnictwo Santorski & Wamex, Warszawa, 1997. [2] Roger Fisher, William Ury, Bruce Patton. Dochodząc do TAK – Negocjowanie bez poddawania się. Polskie Wydawnictwo Ekonomiczne, Warszawa, 2000. [3] Sylwester Laskowski. Game against nature: playing on competitive telecommunications services market without knowledge of competitors’ costs. The Fourth International Conference on Decision Support for Telecommunications and Information Society, Warsaw, 2004. National Institute of Telecommunications. [4] Sylwester Laskowski. Modelowanie gry rynkowej na konkurencyjnym rynku telekomunikacyjnym. Telekomunikacja i techniki Informacyjne, 3(4), 2004. [5] Sylwester Laskowski. O roli informacji na temat macierzy wypłat w konkurencyjnej grze na rynku telekomunikacyjnym. Telekomunikacja i techniki Informacyjne, 3(4), 2004. [6] Sylwester Laskowski. Wspomaganie procesu ustalania cen detalicznych i negocjacji stawek rozliczeniowych na konkurencyjnym rynku usług telekomunikacyjnych. Rozprawa doktorska, Politechnika Warszawska, Wydział Elektroniki i Technik, Warszawa, 2004. [7] Sylwester Laskowski. Criteria of choosing strategy in games against nature. The Fifth International Conference on Decision Support for Telecommunications and Information Society, Warsaw, 2005. National Institute of Telecommunications. [8] Sylwester Laskowski. O kolejności ruchów w dwuosobowej grze na konkurencyjnym rynku telekomunikacyjnym z asymetrią informacyjną. Telekomunikacja i techniki Informacyjne, 3(4), 2005. [9] Sylwester Laskowski. Opracowanie narzędzi analitycznych do wspomagania decyzji dotyczących wysokości opłat taryfikacyjnych i stawek rozliczeniowych na konkurencyjnym rynku telekomunikacyjnym. Praca statutowa, Instytut Łączności, 2005. 99 100 BIBLIOGRAFIA [10] Sylwester Laskowski. Wspomaganie procesu ustalania cen detalicznych na konkurencyjnym rynku telekomunikacyjnym z asymetrią informacyjną. Telekomunikacja i techniki Informacyjne, 3(4), 2005. [11] Sylwester Laskowski. Wprowadzenie do jednokryterialnych 2-osobowych gier rynkowych o sumie niezerowej. Telekomunikacja i techniki Informacyjne, 3(4), 2006. [12] Jacek W. Mercik. Siła i oczekiwania, decyzje grupowe. PWN, Wrocław, 1999. [13] Włodzimierz Ogryczak. Wspomaganie decyzji w warunkach ryzyka. Skrypt wykładu, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki i Informatyki Stosowanej, Warszawa, 2002. [14] Howard Raiffa. The art and since of negotiation. Harvard University Press, Cambridge Massachusetts, 1982. [15] Bernard Roy. Wielokryterialne wspomaganie decyzji. Wydawnictwo Naukowo-Techniczne, Warszawa, 1990. [16] Robert A. Rządca. Negocjacje w interesach. Polskie Wydawnictwo Ekonomiczne, Warszawa, 2003. [17] Philip D. Straffin. Teoria gier. Wydawnictwo Naukowe Scholar, Warszawa, 2001. [18] William Ury. Odchodząc od NIE – negocjowanie od konfrontacji do kooperacji. Polskie Wydawnictwo Ekonomiczne, Warszawa, 2000. [19] Michael Watkins. Sztuka negocjacji w biznesie – innowacyjne podejścia prowadzące do przełomu. Helion, Gliwice, 2005. [20] Andrzej P. Wierzbicki. Sztuka i techniki negocjacji. Skrypt wykładu, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki i Informatyki Stosowanej, Warszawa, 1996. [21] Andrzej P. Wierzbicki. Optymalizacja i wspomaganie decycji. Skrypt wykładu, Politechnika Warszawska, Wydział Elektroniki i Technik Informacyjnych, Instytut Automatyki i Informatyki Stosowanej, Warszawa, 2000. [22] Nikołaj. N. Worobiew, Edward Kofler, Henryk Greniewski. Strategia gier. Książka i Wiedza, Warszawa, 1969.