ij a

Transkrypt

ij a
Fdr
Gra
• to dowolna sytuacja konfliktowa,
• gracz natomiast to dowolny jej uczestnik
• każda strona wybiera pewną strategię postępowania, po
czym zależnie od strategii własnej oraz innych
uczestników każdy gracz otrzymuje wypłatę w
jednostkach użyteczności (pieniądze, wzrost szansy na
przekazanie własnych genów czy też cokolwiek innego, z
czystą satysfakcją włącznie)
• wynikowi gry zwykle przyporządkowuje się pewną
wartość liczbową.
14/04/15
• istota tej gry nie polega na próbie
odgadnięcia intencji gracza, lecz na skrywaniu
własnych zamiarów.
• Podstawowym założeniem teorii gier jest
racjonalne działanie wszystkich podmiotów
decyzyjnych (graczy).
14/04/15
Aby dana sytuacja mogła być nazwana grą, musi spełniać następujące
warunki:
• istnieje skończona liczba uczestników,
• każdy uczestnik posiada skończoną liczbę
sposobów działania (strategii),
• uczestnik, który chce posłużyć się teorią gier, musi
znać wszystkie dostępne pozostałym graczom
strategie, lecz nie może wiedzieć, która z nich
będzie obrana,
• wygrana każdego uczestnika zależy zarówno od
działania pozostałych graczy, jak i od jego
własnego działania,
• wszystkie możliwe wyniki są mierzalne.
14/04/15
Teoria gier
• to dział matematyki zajmujący się badaniem
optymalnego zachowania w przypadku
konfliktu interesów
14/04/15
14/04/15
Badania w zakresie teorii gier i jej zastosowań
wielokrotnie zostały uznane przez Komitet Nagrody
Nobla
• 1978 Herbert Simon
– za wkład w rozwój ewolucyjnej teorii gier, w
szczególności za koncepcję ograniczonej
racjonalności.
– Komitet nagrody określił te rezultaty jako
przełomowe badania nad procesem
podejmowania decyzji wewnątrz organizacji
gospodarczych oraz teorię ich podejmowania.
14/04/15
• 1994 John Nash, Reinhard Selten i John
Harsanyi
– za rozwój teorii gier i jej zastosowania w ekonomii.
• 1996 William Vickrey i James Mirrlees
– za stworzenie modeli przetargów i badanie
konfliktów z niesymetryczną informacją
uczestników.
14/04/15
•
2005 Thomas C. Schelling i Robert J. Aumann
– za zastosowanie teorii gier w naukach społecznych i
mikroekonomii (dot. zachowania jednostek i
rozwiązywania konfliktów) . Ich teoria pozwoliła
zastosować teorię gier – lub teorię decyzji interaktywnej
– do poszukiwania odpowiedzi na pytanie, dlaczego
niektóre grupy, organizacje i kraje odnoszą sukcesy we
współpracy, natomiast inne popadają w konflikty.
– Thomas Schelling stosował teorię gier do analizy
negocjacji międzynarodowych w okresie "zimnej wojny".
Analizował takie zagadnienia, jak: polityka wzajemnych
ustępstw, gróźb, zastraszania.
– Aumann użył teorii gier by zanalizować Talmud. Między
innymi rozwiązał starą tajemnicę "podziału spadku
zmarłego męża pomiędzy jego trzy żony". Rozwiązaniem
było podanie zmniejszenia wartości spadku
(porównanego do jego pierwotnej wartości).
14/04/15
• 2007 Leonid Hurwicz, Eric S. Maskin, Roger B.
Myerson
– za prace nad teorią wdrażającą systemy matematyczne w
procesy gospodarcze, która przy zastosowaniu równań
matematycznych i algorytmów pozwala ocenić
prawidłowość funkcjonowania rynków.
– Teoria ta pomogła określić ekonomistom skuteczne
mechanizmy rynkowe, schematy regulacji i procedury
wyborów i dziś odgrywa główną rolę w wielu dziedzinach
ekonomii oraz w naukach politycznych.
14/04/15
Zalety teorii gier:
• pozwala ustrukturyzować proces decyzyjny i wyznaczyć
racjonalne rozwiązanie.
• możliwość wyznaczenia dobrego rozwiązania zależy jednak
od tego, jak dobrą informacją dysponuje dany podmiot.
• bada jakie strategie powinni wybrać gracze żeby osiągnąć
najlepsze wyniki.
14/04/15
Gry ze względu na wartość dzielą się na:
• gry o sumie stałej (zysk jednego gracza jest
równoważny stracie drugiego) i na gry o
sumie zmiennej
• gry sprawiedliwe (gdy wartość oczekiwana
wypłaty każdego z graczy jest taka sama) oraz
gry niesprawiedliwe
14/04/15
Gra w kasynie
• uznając za wypłatę sumę pieniężną, jest grą o
sumie zerowej (wygrana gracza to strata
kasyna, i na odwrót; nie rozpatrujemy tu
zadowolenia z samego faktu gry), jednakże
nie jest ona grą sprawiedliwą (z przyczyn
oczywistych prawdopodobieństwa wygranej
są dla gracza niekorzystne, a wartość
oczekiwana wygranej pieniężnej ujemna).
14/04/15
Gry
W zależności od liczby tych przeciwników i ich
interesów rozróżniamy różne rodzaje gier, na
przykład:
• gry dwuosobowe,
• gry wieloosobowe,
• gry koalicyjne.
14/04/15
Macierz wypłat
• jest tablicą, która przedstawia kwoty otrzymane
przez gracza wymienionego po lewej stronie tej
tablicy po wszystkich możliwych partiach gry. Wypłat
dokonuje gracz wymieniony u góry tablicy macierz ta
składa się z tylu kolumn, ile jest wszystkich
możliwych sposobów działania gracza
zamieszczonego u góry tablicy, i z tylu wierszy, ile jest
wszystkich możliwych sposobów działania gracza
zamieszczonego po lewej stronie tablicy).
14/04/15
Przykład normalnej formy macierzy wypłat dla gry
dwuosobowej i dwóch możliwych strategii
14/04/15
Gracz 2 wybiera lewą
kolumnę
Gracz 2 wybiera prawą
kolumnę
Gracz 1 wybiera górny
wiersz
4, 3
-1, -1
Gracz 1 wybiera dolny
wiersz
0, 0
3, 4
Historycznym przykładem gry niekooperacyjnej
jest dylemat więźnia.
Problem decyzji aresztowanego A
Działania
A
Działania B
Nie przyznawać się
wsypać kompana
Nie przyznawać się
1 rok
10 lat
Wsypać kompana
0 lat
5 lat
Problem decyzji aresztowanego B
Działania B
Działania A
Nie przyznawać się
wsypać kompana
Nie przyznawać się
1 rok
10 lat
Wsypać kompana
0 lat
5 lat
Gra dwuosobowa aresztowanych
Działania A
Nie przyznawać się
Wsypać kompana
14/04/15
Działania B
Nie przyznawać się
wsypać kompana
1 rok
1 rok
10 lat
0 lat
0 lat
10 lat
5 lat
5 lat
Gra dwuosobowa o sumie zero
• Grami dwuosobowymi o sumie zero są takie
sytuacje, gdy w grze biorą udział tylko dwie
strony, a przegrane jednej ze stron są
wygranymi drugiej.
14/04/15
Macierz wypłat
s1 s 2 ... s n
 a11

[aij ] =  ....
am1
14/04/15
a12 ... a1n  d1

.... ... .... ....

am 2 ... amn d m
Przykład
• Dwie konkurencyjne firmy Alfa i Beta są dealerami dobrze
znanej marki odbiorników telewizyjnych. Roczne zyski tych
dwóch firm wynoszą odpowiednio 4 i 8 mln zł.
• Alfa chce rozszerzyć swoją działalność i otworzyć zakład
montażu odbiorników zakładając, że przyniesie to jej roczny
zysk równy 10 mln zł. Oczekuje przy tym, że firma Beta będzie
kontynuować swoją działalność bez podejmowania montażu
odbiorników u siebie. Jednakże szef firmy Beta usłyszał o
planach firmy Alfa i obliczył, że jeśli plany firmy Alfa będą
urzeczywistnione, to zyski firmy Beta spadną do 2 mln zł.
• Natomiast jeśli Beta uruchomi zakład montażu, a Alfa nie zrobi
tego, to zysk firmy Beta wzrośnie do 11 mln zł, a zysk firmy Alfa
spadnie do 1 mln zł.
• Gdyby obydwie firmy uruchomiły zakłady montażu, to wtedy
obie zarobiłyby po 6 mln zł na rok.
• Jaką strategię powinna wybrać firma Alfa, a jaką Beta, aby zyski
ich były możliwie jak największe?
14/04/15
Macierz
Strategie firmy Beta
Strategie
firmy Alfa
14/04/15
Kontynuowanie
sprzedaży
Uruchomienie
zakładu
montażu
odbiorników
telewizyjnych
Kontynuowani
e sprzedaży
0
-3
Uruchomienie
zakładu
montażu
odbiorników
telewizyjnych
6
2
Gra jest rozwiązana, gdy wyznaczymy:
• wartość gry,
• strategię, którą ma zastosować gracz
umieszczony w macierzy wypłat po lewej
stronie, aby zapewnić sobie średnią wygraną na
partię co najmniej równą wartości gry,
• strategię, którą ma zastosować gracz
umieszczony w górnej części macierzy wypłat,
aby średnia przegrana na partię nie była
większa niż wartość gry.
14/04/15
Strategie firmy Beta
Strategie firmy
Alfa
14/04/15
Kontynuowanie
sprzedaży
Uruchomienie
zakładu
montażu
odbiorników
telewizyjnych
Najmniejsze
wartości w
wierszach
Min a­ij
Kontynuowanie
sprzedaży
0
­3
­3
Uruchomienie
zakładu montażu
odbiorników
telewizyjnych
6
2
2
Max (Min a­ij)
Największe
wartości w
kolumnach
Max a-ij
6
2
Min (Max a­ij)
strategia zdominowana
• występuje, kiedy gracz posiada strategię dającą mu
wyższą wypłatę bez względu na to, jak zagra
konkurent.
14/04/15
Strategia dominująca
• to najlepsza możliwa reakcja na dowolną
strategię zastosowaną przez konkurenta.
• Jej logika nieuchronnie prowadzi do
pogorszenia wyniku, gdy gra ma charakter
niekooperacyjny.
14/04/15
Punkt siodłowy
• gra posiada punkt siodłowy, jeżeli każdy z graczy
podczas całej gry stosuje tylko jeden sposób
działania.
• Punktem siodłowym jest punkt w macierzy wypłat
znajdujący się na przecięciu tych dwóch
sposobów działania, natomiast wypłata w tym
punkcie stanowi wartość gry
• V = VA =Max (Min aij) = VB=Min (Max aij)
• Wartość gry jest średnią kwotą przypadającą na
partię, którą wygrałby w długim okresie jeden z
graczy, gdyby obaj stosowali swe najlepsze strategie.
14/04/15
KRYTERIA WYBORU DECYZJI W
WARUNKACH NIEPEWNOŚCI
• Kryteria nieprobabilistyczne
• Kryteria probabilistyczne
14/04/15
Kryteria nieprobabilistyczne
MaxiMin
Pesymista (asekurant) określa dla każdej
swojej decyzji najgorszy możliwy wynik
(minimalna wypłatę)
, a następnie
p
w
i
wybiera taką decyzję
, dla której
określona minimalna (gwarantowana) d k
wypłata jest największa.
d k :wkp = max{wip },
14/04/15
wip = min
{aij }
j
Kryteria nieprobabilistyczne MaxiMax
Optymista (ryzykant) określa dla każdej swojej
decyzji najwyższy możliwy wynik (maksymalną
wypłatę)
, a następnie wybiera
taka
o
wi
decyzję
, dla której tak określona
dk
maksymalna (ale nie gwarantowana)
wypłata
jest największa.
d k :w = max{w },
o
k
14/04/15
i
o
i
wio = max{aij }
j
Kryteria nieprobabilistyczne kryterium
Hurwicza
Reguła
Hurwicza
przyporządkowuje
di indeks h(d i ) , który
każdej decyzji
jest ważoną przeciętną minimalnej
i maksymalnej wypłaty wynikającej
z decyzji. Wybierana jest strategia,
której odpowiada maksymalna wartość h(⋅)
Oznaczmy przez α - skłonność do bycia
pesymistą przy wyborze strategii α i ∈ [0,1]
14/04/15
Kryteria nieprobabilistyczne kryterium
Hurwicza
Dla każdej decyzji di wyznaczamy
hipotetyczną wygraną h(d ) postaci:
i
h(d i ) = αwip + (1 − α ) wio
Należy wybrać taką decyzję, dla której
hipotetyczna wygrana h(d ) jest największa
i
d k :h(d k ) = max{h(d i )}
i
14/04/15
Macierz"żalu"
Macierz wypłat [aij ] transformujemy do
postaci macierzy "żalu" .[rij ]
W tym celu: określamy maksymalną wypłatę
dla każdego "stanu natury" a = max{a }
j
ij
w dalszym postępowaniu obliczamy wartości
elementów
według wzoru:
rij = a j − aij
r
ij
Elementy macierzy "żalu" wyrażają stratę
z powodu podjęcia decyzji nieoptymalnej
z punktu widzenia zaistniałego stanu natury.
14/04/15
i
Kryteria nieprobabilistyczne Minimax
"żalu"
Do macierzy "żalu" stosujemy postępowanie
według reguły MinMax, tzn. wskazujemy
decyzję, dla której największa strata ("żal")
z powodu źle podjętej decyzji będzie możliwie
najmniejsza, czyli
d k :rk = min{ri },
i
14/04/15
rj = max{rij }
j
Kryteria probabilistyczne
Maksymalna oczekiwana wygrana
Wybieramy taką decyzję, dla której wartość
oczekiwanej wygranej (zysku) będzie
największa, tj.
d k :E = max{E }
a
k
14/04/15
i
a
i
Eia = ∑ P( s j )aij
j
P( s j )
Kryteria probabilistyczne Minimalny
oczekiwany "żal" (strata)
• Wybieramy taką decyzję, dla której wartość
oczekiwanej straty ("żalu") będzie
najmniejsza, tj.
r
r
E = ∑ P( s )r
d k :Ek = min{Ei }
i
r
i
j
j
14/04/15
ij
W zarządzaniu działalnością gospodarczą wynik decyzji jest zwykle
rozpatrywany z punktu widzenia rentowności danego przedsięwzięcia,
a poszczególne stany natury są wyrażane w postaci efektów
finansowych wynikających z różnych wyników podjętej decyzji. W
takiej sytuacji wartość oczekiwana ma wymiar finansowy i stąd
nazywamy ją oczekiwanym efektem finansowym.
Parametr ten często oznacza się angielskim skrótem EMV (Expected
Monetary Value) i oblicza się dla każdej strategii według równania:
n
EMV = ∑ V j Pj
j =1
gdzie:
V - efekt finansowy j-tego stanu natury (wartości dodatnie dla zysku,
wartości ujemne dla strat),
P
- prawdopodobieństwo uzyskania j-tego efektu finansowego.
j
j
14/04/15
dr inż. Iwona Staniec
Przykład
Przedsiębiorstwo ma możliwość uruchomienia produkcji i sprzedaży produktu
luksusowego lub produktu popularnego. Dla każdej opcji decyzyjnej określono
- na podstawie prognoz i analiz danych statystycznych - prawdopodobieństwa
uzyskania sprzedaży dobrej, średniej i miernej oraz efekty finansowe tych
wyników.
Dla produktu luksusowego prawdopodobieństwo wystąpienia dobrej sprzedaży (z
której dochody wyniosą 120000 zł) wynosi 0,4, sprzedaży średniej (o
dochodzie 65 000 zł) - 0,3 oraz sprzedaży miernej (dochód 12 000 zł) - 0,3.
Analogicznie dla produktu popularnego - prawdopodobieństwo dobrej sprzedaży
wynosi 0,5 (dochód 105 000 zł), sprzedaży średniej - 0,4 (dochód 55 000 zł) i
sprzedaży miernej - 0,1 (dochód tylko 20000 zł).
Oceń, która z opcji decyzyjnych dotycząca wyboru nowej produkcji jest bardziej
opłacalna dla przedsiębiorstwa.
14/04/15
Rozwiązanie
Obliczamy wartość oczekiwaną dochodu dla produktu luksusowego (PL):
EMV(PL) = 0,4*120000 + 0,3*65000 + 0,3*12000 = 71100 zł.
Tak więc wartość oczekiwana dla PL wynosi 71 100 zł.
Podobnie liczymy dla produktu popularnego (PP):
EMV(PP) = 0,5*105000 + 0,4*55000 + 0,1*10000 = 75500 zł.
Z porównania wartości EMV(PL) i EMV(PP) wynika, że korzystniejszą opcją
decyzyjną jest wprowadzenie na rynek produktu popularnego.
14/04/15
14/04/15
• STRATEGIA CZYSTA gracz wybiera jedna
konkretną strategię
• STRATEGIA MIESZANA gracz wybiera z
określonym prawdopodobieństwem jedną z
kilku strategii
14/04/15
Gra 3 o sumie nie zerowej
F
I
R 1
M
A
14/04/15
F I R MA 2
oszustwo uczciwość
oszustwo
2
2
3,5 1,5
uczciwość
1,5
3,5
3
3
4
3,5
UO
3
UU
firma 2
2,5
2
OO
1,5
OU
1
0,5
0
0
14/04/15
0,5
1
1,5
2
firma 1
2,5
3
3,5
4
Pretooptymalny
• Wynik gry jest nieooptymalny w sensie
Pareto jeżeli gra ma inny możliwy wynik dający
oby graczom co najwyżej nie gorsze wygrane
• Kryterium Pareto jest podstawową zasada
racjonalności grupowej (wchodzi w konflikt z
zasadą racjonalności indywidualnej)
14/04/15

Podobne dokumenty