3 - Modele gier
Transkrypt
3 - Modele gier
Badania operacyjne Temat 3: Modele teorii gier. Gra dwuosobowa o sumie zero. 1. Teoria gier może być stosowana wówczas, gdy: • • • • istnieją dwaj gracze, z których każdy dysponuje określonym zbiorem strategii; każdy z graczy zna możliwe strategie przeciwnika, nie wie natomiast, którą z nich wybierze przeciwnik; dane są liczbowe oceny realizacji poszczególnych strategii obu graczy; każdy z graczy dąży do realizacji takiej strategii, z którą związana jest większa efektywność. 2. Podstawowe pojęcia oraz definicje 2.1. Niech dwaj gracze, oznaczeni symbolami G1 , G2 , dysponują ustalonymi skończonymi zbiorami strategii. { } { } Pierwszy z nich ma do dyspozycji zbiór strategii: S1 = s1(1) , s2(1) ,..., sm(1) , drugi: S 2 = s1(2) , s2(2) ,..., sn(2) . Każdej parze strategii jest jednoznacznie przyporządkowana liczbowa ocena realizacji i-tej strategii gracza G1 , przy wystąpieniu j-tej strategii gracza G2 . Nazwiemy ją wypłatą gry gracza G1 i oznaczamy: w1 ( si(1) ,= s (2) a= i 1, 2,...,= m; j 1, 2,..., n. Oceny te tworzą macierz wypłaty gracza pierwszego j ) ij , postaci: A = aij m× n . Analogicznie każdej parze strategii jest jednoznacznie przyporządkowana liczbowa ocena realizacji j-tej strategii gracza G2 , przy wystąpieniu i-tej strategii gracza G1 , czyli wypłata gracza ( ) drugiego. Oznaczamy ją: w2 s (2) , si(1) b= i 1, 2,...,= m; j 1, 2,..., n. Mamy macierz wypłaty gracza j = ij , drugiego postaci: B = bij m× n . Gracz G1 może realizować swoje strategie z częstością p1 , p2 ,... pm , gdzie 0 ≤ pi ≤ 1 oraz Gracz G2 może realizować swoje strategie z częstością r1 , r2 ,...rn , gdzie 0 ≤ rj ≤ 1 oraz m ∑p n ∑r j =1 i i =1 j = 1. = 1. Częstość występowania poszczególnych strategii gracza pierwszego i drugiego zapiszemy w postaci wektorów: P = [ p1 p2 … pm ]m×1 oraz R = [ r1 r2 … rn ]1× n . T Regulamin gry: • każdy z graczy równolegle i niezależnie wykonuje ruch (tzn. wybiera pewną strategię ze zbioru możliwych dla siebie strategii); • każdy z graczy dąży do osiągnięcia optymalnej wypłaty; • po wykonaniu ruchu przez obu graczy następuje wypłata. 2.2. Skończoną normalną grą dwuosobową o sumie zero nazywamy każdą grę, w której występują dwaj gracze, dokonujący świadomego wyboru strategii, zgodnie z powyższym regulaminem, o macierzach spełniających warunek A + B = 0 (tzn. wygrana pierwszego gracza jest przegraną drugiego gracza). Strategią optymalną gracza G1 nazwiemy taki dobór elementów wektora P , który zapewni mu uzyskanie maksymalnej oczekiwanej wypłaty, przy założeniu, że gracz G2 będzie dążył do minimalizacji tej wypłaty. Dolną wartością gry nazywamy liczbę w1 = max min aij . j i Górną wartością gry nazywamy liczbę w2 = min max aij . j i Punktem siodłowym gry nazywamy taki element macierzy wypłaty, w którym: max min aij = min max aij . i j Grą zamkniętą nazywamy grę posiadającą punkt siodłowy. Grą otwartą nazywamy grę nie posiadającą punktu siodłowego. Strategiami czystymi poszczególnych graczy nazywamy strategie spełniające warunek: = oraz pi 0 dla i ≠ k pk 1= = 1= oraz rj 0 dla j ≠ l rl 1 j i Badania operacyjne Temat 3: Modele teorii gier. Gra dwuosobowa o sumie zero. Strategiami mieszanymi poszczególnych graczy nazywamy strategie spełniające warunek: 0 < pi < 1 oraz 0 < r < 1 oraz j m ∑p i i =1 n ∑r j =1 j = 1 = 1 Strategia sk(1) jest strategią zdominowaną przez strategię dominującą sl(1) z punktu widzenia gracza pierwszego, jeżeli zachodzi: akj ≤ alj , 1, 2,..., n. j= Strategia sr(2) jest strategią zdominowaną przez strategię dominującą ss(2) z punktu widzenia gracza drugiego, jeżeli zachodzi: air ≥ ais , i = 1, 2,..., m. Oczekiwana wartość wypłaty graczy, przy założeniu, że gracz pierwszy będzie stosował swoje strategie z częstością P , a drugi z częstością R , wynosi: = E ( P; R ) m n = pi aij rj PT ART ∑∑ =i 1 =j 1 3. Twierdzenia 3.1. Podstawowe twierdzenie teorii gier. Każda normalna gra skończona o sumie zero posiada w zakresie strategii mieszanych określoną wartość gry i każdy z graczy ma co najmniej jedną strategię optymalną, określoną przez wektory: = P0 = pi(0) , R0 rj(0) . m ×1 1× n 3.2. Każdą skończoną dwuosobową grę normalną o sumie zero można sprowadzić do liniowego modelu decyzyjnego. 4. Gra dwuosobowa o sumie zero a liniowy model decyzyjny Gracz pierwszy stosując strategię mieszaną dąży do tego, aby niezależnie od strategii gracza drugiego jego oczekiwana wypłata wynosiła co najmniej w = E ( P; R ) , czyli: m ∑ aij pi ≥ w, i=1 m ∑ pi = 1, i=1 pi ≥ 0, j= 1, 2,..., n, i= 1, 2,..., m oraz do tego, by wartość oczekiwanej wypłaty była jak największa, co jest równoważne minimalizacji odwrotności wartości oczekiwanej wypłaty. Dzieląc poszczególne relacje w układzie powyżej przez w oraz podstawiając = xi pi = i 1, 2,..., m ) dostajemy liniowy model decyzyjny postaci: w ( m 1, 2,..., n, ∑ aij xi ≥ 1, j = i =1 m 1 ∑ xi = , w i =1 xi ≥ 0, i = 1, 2,..., m m 1 = min ∑ xi f = X ( 0) min w i =1 ( ) 2 Badania operacyjne Temat 3: Modele teorii gier. Gra dwuosobowa o sumie zero. Zadanie 1 Dana jest macierz wypłat gry dwuosobowej o sumie zero: a) 1 3 2 4 1 −3 5 0 −5 7 −1 1 2 4 3 −1 5 −6 b) Czy gra ma rozwiązanie w zbiorze strategii czystych, czy w zbiorze strategii mieszanych? Zadanie 2 Dwaj producenci pewnego wyrobu sprzedają swe wyroby na rynku, którego wielkość jest stała. Aby zwiększyć swój udział w rynku, każde z nich może zastosować jedną z trzech strategii marketingowych. Strategie przedsiębiorstwa A to: A1, A2, A3, a strategie przedsiębiorstwa B to: B1, B2, B3. W tablicy poniżej dany mamy wzrost udziału w rynku (w %) przedsiębiorstwa A (spadek udziału przedsiębiorstwa B) w zależności od decyzji podjętych przez przedsiębiorstwa. A B A1 A2 A3 B1 B2 B3 3 -1 0 -3 5 -4 7 2 4 Znaleźć optymalne strategie marketingowe dla obu przedsiębiorstw. Zadanie 3 Dwie stacje telewizyjne konkurują o 10 milionową publiczność. Najbardziej zaciekła walka rozgrywa się między godziną 20:00 a 21:00. Stacje telewizyjne jednocześnie i niezależnie od siebie ogłaszają rozkład programu. Potencjalne strategie i wynikające z nich efekty oglądalności zawarte są w poniższej tabeli: Stacja telewizyjna nr 2 Stacja telewizyjna nr 1 Film obyczajowy Opera mydlana Komedia Film obyczajowy 3,5 1,5 6,0 Opera mydlana 4,5 5,8 5,0 Komedia 3,8 1,4 7,0 Wyznacz: • Wektory częstości realizacji poszczególnych strategii obu stacji telewizyjnych. • Średnią wartość gry. Zadanie 4 Dwóch graczy jednocześnie wybiera liczbę jeden lub dwa, obwieszczając swój wybór wystawiając jeden lub dwa palce. Jeśli suma wystawionych palców jest parzysta, gracz pierwszy wygrywa złotówkę, jeśli suma jest nieparzysta, złotówkę wygrywa gracz drugi. Wyznacz: • Wektory częstości realizacji poszczególnych strategii obu graczy. • Średnią wartość gry. 3 Badania operacyjne Temat 3: Modele teorii gier. Gra dwuosobowa o sumie zero. Zadanie 5 Rozwiąż grę dwuosobową o sumie zero, gdzie symbolami A i B oznaczono obu graczy, a wektory X = [x1 x 2 x3] oraz Y = [y1 y 2 y 3] oznaczają odpowiednio strategie gracza A i B. A B x1 x2 x3 y1 y2 y3 2 3 2 4 1 3 6 4 3 1. Czy gra ma rozwiązanie w zbiorze strategii czystych? 2. Czy występują strategie zdominowane? Zadanie 6 Rozwiąż grę dwuosobową o sumie zero, której macierz wypłat podana jest w tabeli: A B A1 A2 B1 B2 B3 5 2 0 4 1 3 Zadanie 7 Dwóch graczy wybiera liczbę 1 lub 2, jednocześnie odgadując, jaką liczbę wybrał przeciwnik. Jeśli obaj gracze odgadli lub obaj pomylili się, nic sobie nie płacą. Jeśli odgadł tylko jeden, wygrywa sumę równą liczbie wystawionych palców. Wyznacz: • Macierz gry. • Modele programowania liniowego pozwalające na wyznaczenie wektorów częstości realizacji poszczególnych strategii obu graczy. • Wektory częstości realizacji poszczególnych strategii obu graczy. • Średnią wartość gry. Zadanie 8 Dwaj maklerzy giełdowi reprezentują dwie znaczące instytucje finansowe inwestujące w akcje trzech spółek. Wyniki inwestycyjne uzyskane przez obydwu maklerów nie pozostają bez wpływu na wybory zainteresowanych powierzaniem kapitału inwestycyjnego w celu jego pomnażania. Indywidualni inwestorzy w swoich wyborach kierują się przede wszystkim wynikami uzyskiwanymi przez obydwie instytucje finansowe, stąd wyniki uzyskiwane przez zatrudnionych w obydwu instytucjach maklerów są tak ważne w kształtowaniu postrzegania profesjonalizmu powierniczych instytucji finansowych. Elementy macierzy wypłat są różnicą pomiędzy stopą zwrotu z inwestycji uzyskanych przez maklera A oraz B. Makler B Makler A S1B S2B S3B S1A 3 0 -3 S2A 1 -2 0 S3A 0 4 3 Określ polityki inwestycyjne (wybory strategii {si A} , {si B } ) tak, aby wynik inwestycyjny obydwu maklerów określał sytuację rozwiązania optymalnego. 4