3 - Modele gier

Transkrypt

3 - Modele gier

Badania operacyjne
Temat 3:
Modele teorii gier. Gra dwuosobowa o sumie zero.
1. Teoria gier może być stosowana wówczas, gdy:
•
•
•
•
istnieją dwaj gracze, z których każdy dysponuje określonym zbiorem strategii;
każdy z graczy zna możliwe strategie przeciwnika, nie wie natomiast, którą z nich wybierze przeciwnik;
dane są liczbowe oceny realizacji poszczególnych strategii obu graczy;
każdy z graczy dąży do realizacji takiej strategii, z którą związana jest większa efektywność.
2. Podstawowe pojęcia oraz definicje
2.1. Niech dwaj gracze, oznaczeni symbolami G1 , G2 , dysponują ustalonymi skończonymi zbiorami strategii.
{
}
{
}
Pierwszy z nich ma do dyspozycji zbiór strategii: S1 = s1(1) , s2(1) ,..., sm(1) , drugi: S 2 = s1(2) , s2(2) ,..., sn(2) .
Każdej parze strategii jest jednoznacznie przyporządkowana liczbowa ocena realizacji i-tej strategii gracza
G1 , przy wystąpieniu j-tej strategii gracza G2 . Nazwiemy ją wypłatą gry gracza G1 i oznaczamy:
w1 ( si(1) ,=
s (2)
a=
i 1, 2,...,=
m; j 1, 2,..., n. Oceny te tworzą macierz wypłaty gracza pierwszego
j )
ij ,
postaci: A =  aij 
m× n
. Analogicznie każdej parze strategii jest jednoznacznie przyporządkowana liczbowa
ocena realizacji j-tej strategii gracza G2 , przy wystąpieniu i-tej strategii gracza G1 , czyli wypłata gracza
(
)
drugiego. Oznaczamy ją: w2 s (2)
, si(1) b=
i 1, 2,...,=
m; j 1, 2,..., n. Mamy macierz wypłaty gracza
j =
ij ,
drugiego postaci: B = bij 
m× n
.
Gracz G1 może realizować swoje strategie z częstością p1 , p2 ,... pm , gdzie 0 ≤ pi ≤ 1 oraz
Gracz G2 może realizować swoje strategie z częstością r1 , r2 ,...rn , gdzie 0 ≤ rj ≤ 1 oraz
m
∑p
n
∑r
j =1
i
i =1
j
= 1.
= 1.
Częstość występowania poszczególnych strategii gracza pierwszego i drugiego zapiszemy w postaci
wektorów: P = [ p1
p2 … pm ]m×1 oraz R = [ r1
r2 … rn ]1× n .
T
Regulamin gry:
• każdy z graczy równolegle i niezależnie wykonuje ruch (tzn. wybiera pewną strategię ze zbioru
możliwych dla siebie strategii);
• każdy z graczy dąży do osiągnięcia optymalnej wypłaty;
• po wykonaniu ruchu przez obu graczy następuje wypłata.
2.2. Skończoną normalną grą dwuosobową o sumie zero nazywamy każdą grę, w której występują dwaj gracze,
dokonujący świadomego wyboru strategii, zgodnie z powyższym regulaminem, o macierzach
spełniających warunek A + B =
0 (tzn. wygrana pierwszego gracza jest przegraną drugiego gracza).
Strategią optymalną gracza G1 nazwiemy taki dobór elementów wektora P , który zapewni mu uzyskanie
maksymalnej oczekiwanej wypłaty, przy założeniu, że gracz G2 będzie dążył do minimalizacji tej
wypłaty.
Dolną wartością gry nazywamy liczbę w1 = max min aij .
j
i
Górną wartością gry nazywamy liczbę w2 = min max aij .
j
i
Punktem siodłowym gry nazywamy taki element macierzy wypłaty, w którym: max min aij = min max aij .
i
j
Grą zamkniętą nazywamy grę posiadającą punkt siodłowy.
Grą otwartą nazywamy grę nie posiadającą punktu siodłowego.
Strategiami czystymi poszczególnych graczy nazywamy strategie spełniające warunek:
=
oraz pi 0 dla i ≠ k
 pk 1=

=
1=
oraz rj 0 dla j ≠ l
rl
1
j
i
Badania operacyjne
Temat 3:
Strategiami mieszanymi poszczególnych graczy nazywamy strategie spełniające warunek:

0 < pi < 1 oraz


0 < r < 1 oraz
j

m
∑p
i
i =1
n
∑r
j =1
j
=
1
=
1
Strategia sk(1) jest strategią zdominowaną przez strategię dominującą sl(1) z punktu widzenia gracza
pierwszego, jeżeli zachodzi: akj ≤ alj ,
1, 2,..., n.
j=
Strategia sr(2) jest strategią zdominowaną przez strategię dominującą ss(2) z punktu widzenia gracza
drugiego, jeżeli zachodzi: air ≥ ais , i = 1, 2,..., m.
Oczekiwana wartość wypłaty graczy, przy założeniu, że gracz pierwszy będzie stosował swoje strategie z
częstością P , a drugi z częstością R , wynosi:
=
E ( P; R )
m
n
=
pi aij rj PT ART
∑∑
=i 1 =j 1
3. Twierdzenia
3.1. Podstawowe twierdzenie teorii gier.
Każda normalna gra skończona o sumie zero posiada w zakresie strategii mieszanych określoną wartość
gry i każdy z graczy ma co najmniej jedną strategię optymalną, określoną przez wektory:
=
P0 =
pi(0)  , R0  rj(0)  .
m ×1
1× n
3.2. Każdą skończoną dwuosobową grę normalną o sumie zero można sprowadzić do liniowego modelu
decyzyjnego.
4. Gra dwuosobowa o sumie zero a liniowy model decyzyjny
Gracz pierwszy stosując strategię mieszaną dąży do tego, aby niezależnie od strategii gracza drugiego jego
oczekiwana wypłata wynosiła co najmniej w = E ( P; R ) , czyli:
m
∑ aij pi ≥ w,
 i=1
m

 ∑ pi = 1,
 i=1

pi ≥ 0,


j=
1, 2,..., n,
i=
1, 2,..., m
oraz do tego, by wartość oczekiwanej wypłaty była jak największa, co jest równoważne minimalizacji
odwrotności wartości oczekiwanej wypłaty. Dzieląc poszczególne relacje w układzie powyżej przez w oraz
podstawiając
=
xi
pi
=
i 1, 2,..., m ) dostajemy liniowy model decyzyjny postaci:
w (
m
1, 2,..., n,
∑ aij xi ≥ 1, j =
i =1

 m
1
 ∑ xi = ,
w
 i =1

xi ≥ 0, i =
1, 2,..., m


m
1
= min ∑ xi
f =
X ( 0) min
w
i =1
(
)
2
Badania operacyjne
Temat 3:
Zadanie 1
Dana jest macierz wypłat gry dwuosobowej o sumie zero:
a)
1
3 2
 4 1 −3


 5 0 −5
 7 −1 1
 2 4
3

 −1 5 −6 
b)
Czy gra ma rozwiązanie w zbiorze strategii czystych, czy w zbiorze strategii mieszanych?
Zadanie 2
Dwaj producenci pewnego wyrobu sprzedają swe wyroby na rynku, którego wielkość jest stała. Aby zwiększyć
swój udział w rynku, każde z nich może zastosować jedną z trzech strategii marketingowych. Strategie
przedsiębiorstwa A to: A1, A2, A3, a strategie przedsiębiorstwa B to: B1, B2, B3. W tablicy poniżej dany mamy
wzrost udziału w rynku (w %) przedsiębiorstwa A (spadek udziału przedsiębiorstwa B) w zależności od decyzji
podjętych przez przedsiębiorstwa.
A
B
A1
A2
A3
B1
B2
B3
3
-1
0
-3
5
-4
7
2
4
Znaleźć optymalne strategie marketingowe dla obu przedsiębiorstw.
Zadanie 3
Dwie stacje telewizyjne konkurują o 10 milionową publiczność. Najbardziej zaciekła walka rozgrywa się między
godziną 20:00 a 21:00. Stacje telewizyjne jednocześnie i niezależnie od siebie ogłaszają rozkład programu.
Potencjalne strategie i wynikające z nich efekty oglądalności zawarte są w poniższej tabeli:
Stacja telewizyjna nr 2
Stacja telewizyjna nr 1
Film obyczajowy
Opera mydlana
Komedia
Film obyczajowy
3,5
1,5
6,0
Opera mydlana
4,5
5,8
5,0
Komedia
3,8
1,4
7,0
Wyznacz:
• Wektory częstości realizacji poszczególnych strategii obu stacji telewizyjnych.
• Średnią wartość gry.
Zadanie 4
Dwóch graczy jednocześnie wybiera liczbę jeden lub dwa, obwieszczając swój wybór wystawiając jeden lub dwa
palce. Jeśli suma wystawionych palców jest parzysta, gracz pierwszy wygrywa złotówkę, jeśli suma jest
nieparzysta, złotówkę wygrywa gracz drugi.
Wyznacz:
• Wektory częstości realizacji poszczególnych strategii obu graczy.
3
Badania operacyjne
Temat 3:
Zadanie 5
Rozwiąż grę dwuosobową o sumie zero, gdzie symbolami A i B oznaczono obu graczy, a wektory
X = [x1 x 2 x3] oraz Y = [y1 y 2 y 3] oznaczają odpowiednio strategie gracza A i B.
A
B
x1
x2
x3
y1
y2
y3
2
3
2
4
1
3
6
4
3
1. Czy gra ma rozwiązanie w zbiorze strategii czystych?
2. Czy występują strategie zdominowane?
Zadanie 6
Rozwiąż grę dwuosobową o sumie zero, której
macierz wypłat podana jest w tabeli:
A
B
A1
A2
B1
B2
B3
5
2
0
4
1
3
Zadanie 7
Dwóch graczy wybiera liczbę 1 lub 2, jednocześnie odgadując, jaką liczbę wybrał przeciwnik. Jeśli obaj gracze
odgadli lub obaj pomylili się, nic sobie nie płacą. Jeśli odgadł tylko jeden, wygrywa sumę równą liczbie
wystawionych palców.
Wyznacz:
• Macierz gry.
• Modele programowania liniowego pozwalające na wyznaczenie wektorów częstości realizacji
poszczególnych strategii obu graczy.
• Wektory częstości realizacji poszczególnych strategii obu graczy.
Zadanie 8
Dwaj maklerzy giełdowi reprezentują dwie znaczące instytucje finansowe inwestujące w akcje trzech spółek.
Wyniki inwestycyjne uzyskane przez obydwu maklerów nie pozostają bez wpływu na wybory zainteresowanych
powierzaniem kapitału inwestycyjnego w celu jego pomnażania. Indywidualni inwestorzy w swoich wyborach
kierują się przede wszystkim wynikami uzyskiwanymi przez obydwie instytucje finansowe, stąd wyniki
uzyskiwane przez zatrudnionych w obydwu instytucjach maklerów są tak ważne w kształtowaniu postrzegania
profesjonalizmu powierniczych instytucji finansowych.
Elementy macierzy wypłat są różnicą pomiędzy stopą zwrotu z inwestycji uzyskanych przez maklera A oraz B.
Makler B
Makler A
S1B
S2B
S3B
S1A
3
0
-3
S2A
1
-2
0
S3A
0
4
3
Określ polityki inwestycyjne (wybory strategii {si A} , {si B } ) tak, aby wynik inwestycyjny obydwu maklerów
określał sytuację rozwiązania optymalnego.
4

3 - Modele gier

Transkrypt

Podobne dokumenty

Powiatowy Turniej Scrabble w Garwolinie – 4

Lista 2

Propozycje v jazyku polskym

aristotle`s laugh calumnious denunciation demonology

Zostań hersztem piratów! Buduj swoją piracką flotę

Gra jako łańcuch Markowa

Drukowanie strony

Program „Symulator kasyna”