N-osobowy dylemat więźnia

Transkrypt

N-osobowy dylemat więźnia
Wstęp
N-osobowy dylemat więźnia
Krzysztof Balas
Jakub Kolecki
Politechnika Gdańska
17 listopada 2011
Wstęp
Plan prezentacji
1
2
Gra
Klasyczny dylemat więźnia
•
•
•
•
3
N-osobowy dylemat więźnia
•
•
•
•
•
4
Historia
Opowieść
Podejście do problemu
Analiza
Opis zagadnienia
Funkcja charakterystyczna w odniesieniu do dylematu
Rozwiązanie i wnioski
Przykłady
Zastosowania
Uogólnienie zagadnienia i wyniki przeprowadzonych
eksperymentów
Wstęp
Eksperyment
Stwórzcie 5-osobowe grupy i zagrajcie 10 razy w grę:
Decyzja gracza
C
D
ilu pozostałych graczy gra C
0 1 2 3 4
-2 -1 0 1 2
-1 0 1 2 3
Zapisujcie za każdym razem decyzje i wypłaty. Na koniec obliczcie
łączne wypłaty wszystkich graczy i dla każdego porównajcie jej
wysokość z liczbą przypadków, w których zagrał C.
Wstęp
Historia
Dylemat więźnia wymyślili dwaj pracownicy RAND Corporation:
Melvin Dresher i Merrill Flood w 1950 roku.
Albert W. Tucker sformalizował jego zasady.
Wstęp
Opowieść
Dwóch podejrzanych zostało zatrzymanych przez policję. Policja,
nie mając wystarczających dowodów do postawienia zarzutów,
rozdziela więźniów i przedstawia każdemu z nich tę samą ofertę:
jeśli będzie zeznawać przeciwko drugiemu, a drugi będzie milczeć,
to zeznający wyjdzie na wolność, a milczący dostanie dziesięcioletni
wyrok. Jeśli obaj będą milczeć, obaj odsiedzą 6 miesięcy za inne
przewinienia. Jeśli obaj będą zeznawać, obaj dostaną pięcioletnie
wyroki. Każdy z nich musi podjąć decyzję niezależnie i żaden nie
dowie się czy drugi milczy czy zeznaje, aż do momentu wydania
wyroku. Jak powinni postąpić?
Wstęp
Podejście do problemu
Możliwe wyniki gry:
Więzień A milczy
Więzień A zeznaje
Więzień B milczy
Obaj skazani na 6 miesięcy
Więzień A: wolny,
Więzień B: 10 lat
Więzień B zeznaje
Więzień A: 10 lat,
Więzień B: wolny
Obaj skazani na 5 lat
Wstęp
Przykładowa macierz wypłat:
Współpracuj
Oszukuj
Współpracuj
3,3
5,0
Oszukuj
0,5
1,1
Wstęp
Analiza
Ogólna postać dylematu:
Współpracuj
Oszukuj
Współpracuj
R,R
T,S
Oszukuj
S,T
P,P
gdzie:
T- pokusa zdrady
R- nagroda za współpracę
P- kara za zdradę
S- wypłata oszukanego
T >R>P>S
(1)
Wstęp
Analiza: Równowaga Nasha
Oszukuj jest strategią ściśle dominującą: niezależnie od tego co
robi przeciwnik, zawsze bardziej opłaca się oszukiwać niż
współpracować. Racjonalny gracz będzie tylko oszukiwał i jedyną
równowagą Nasha jest punkt (Oszukuj, Oszukuj).
W efekcie obaj zyskają mniej, niż gdyby obaj współpracowali.
Wstęp
N-osobowy dylemat więźnia
N-osobowym dylematem więźnia nazywamy każdą grę, w której
każdy z N graczy ma dwie strategie. Jedna z nich jest ściśle
dominująca, lecz jeżeli wszyscy gracze wybiorą tą strategię to
uzyskają niższe wypłaty, niż wybierając strategię zdominowaną.
Wstęp
Gra 3-osobowa
Rysunek: Tabela wypłat dla 3-osobowego dylematu więźnia
• Gra symetryczna
• Strategia D dominuje C dla każdego gracza
• DDD - punkt równowagi
• CCC dominuje DDD w sensie Pareto
Wstęp
Gra 3-osobowa
• N = 3 > 2 pozawala na nawiązywanie współpracy:
Rysunek: Tabela wypłat przy koalicji Kolumny i Warstwy
• gra posiada punkt siodłowy
Wstęp
Gra w postaci funkcji charakterystycznej
Grą w postaci funkcji charakterystycznej nazywamy grę opisywaną
przez N - zbiór graczy oraz ν : 2N → R.
ν(S) określa łączną wygraną koalicji S (zakładamy, że S gra
najoptymalniej, w najmniej korzystnych warunkach).
Grę nazywamy superaddytywną, jeżeli ν(S ∪ T ) ≥ ν(S) + ν(T )
Wstęp
Gra 3-osobowa
Funkcje charakterystyczna związana z opisywanym przypadkiem
przyjmuje następujące wartości:
ν(∅) = 0
ν(W ) = ν(K ) = ν(L) = −1
ν(WK ) = ν(WL) = ν(KL) = 3
ν(WKL) = 0
Wstęp
Wnioski z dylematu więźnia
• Wnioski cięgnięte z funkcji charakterystycznych mogą być
mylące
• Dążenie do współpracy w niektórych sytuacjach bywa
ryzykowne
• Najcenniejszą cechą jest oportunizm, cnota może być karana
Powyższe wniostki dotyczą N-osobowej wersji gry o sumie
niezerowej i jej funkcji charakterystycznej.
Wstęp
Przykład z pastuszkami
Wyobraźmy sobie grupę farmerów użytkujących wspólne pastwisko.
Każdy z nich zastanawia się czy nie wypasać dodatkowej krowy.
Korzyścią będzie dochód przynoszony przez kolejną krowę. Strata
wynika z tego, że nadmiernie eksploatowane pastwisko może
ograniczyć swą produktywność. Jest to strata, która rozłoży się po
równo na wszystkich i każdy z nich straci na tym niewiele.
Ponieważ korzyść odniesiona przez pojedynczego farmera jest
większa niż jego strata, racjonalne postępowanie polega na
wypasaniu większej liczby krów. Podobnie postępują inni farmerzy
i w końcu nadmiernie eksploatowane pastwisko przestaje
komukolwiek przynosić korzyści.
Wstęp
Przykladowa macierz wypłat:
Liczba krów
10
11
12
13
14
15
16
17
18
19
20
Zysk z jednej
1000
900
800
700
600
500
400
300
200
100
0
Zysk łącznie
10000
9900
9600
9100
8400
7500
6400
5100
3600
1900
0
Wstęp
Odniesienie do rzeczywistości
Interakcje w społeczeństwie jak i w przyrodzie charakteryzują się
podobnymi wypłatami jak w dylemacie więźnia.
1
Nauki społeczne
• Ekonomia
• Polityka
• Socjologia
Wstęp
Odniesienie do rzeczywistości
Interakcje w społeczeństwie jak i w przyrodzie charakteryzują się
podobnymi wypłatami jak w dylemacie więźnia.
1
Nauki społeczne
• Ekonomia
• Polityka
• Socjologia
2
Nauki biologiczne
• Etologia (zachowania zwierząt)
• Biologia ewolucyjna (pochodzenie gatunków)
Wstęp
Przykłady z życia
1
Politologia
• Wyścig zbrojeń
Wstęp
Przykłady z życia
1
Politologia
• Wyścig zbrojeń
2
Demografia
• Przeludnienie
Wstęp
Przykłady z życia
1
Politologia
• Wyścig zbrojeń
2
Demografia
• Przeludnienie
3
Środowisko
• Wyczerpywanie się zapasów naturalnych
• Zanieczyszczenie środowiska
Wstęp
Przykłady z życia
1
Politologia
• Wyścig zbrojeń
2
Demografia
• Przeludnienie
3
Środowisko
• Wyczerpywanie się zapasów naturalnych
• Zanieczyszczenie środowiska
4
Sport
• Kolarstwo
• Gwałtowne tracenie wagi
• Doping
Wstęp
Przykłady z życia
1
Politologia
• Wyścig zbrojeń
2
Demografia
• Przeludnienie
3
Środowisko
• Wyczerpywanie się zapasów naturalnych
• Zanieczyszczenie środowiska
4
Sport
• Kolarstwo
• Gwałtowne tracenie wagi
• Doping
5
Rozrywka
• Wstawanie z miejsc w czasie koncertu rockowego
Wstęp
Znaczenie zjawiska
Model n-osobowego Dylematu Więźnia ma zasadnicze znaczenie
dla rozważań nad problemami gospodarczymi. Rozwiązaniem
takich problemów może być zgoda wszystkich na zbiorowy
przymus. Byłoby to dla wszystkich przymuszanych opłacalnym
wyjściem.
Wstęp
Uogólnienia i przeprowadzone eksperymenty
• Wyniki naszej gry:
kooperator
grupa kooperatorów
-5,7
grupa indywidualistów
• Udowodniono, że więźniowie ”uczą się”
dezerter
4,4
-3,7
• Wartości wypłat przy nieskończonej liczbie iteracji rosną do
ustalonego poziomu
Wstęp
Uogólnienia zagadnienia
1
Iterowany dylemat więźnia
• Wielokrotne rozegranie gry z jednym przeciwnikiem
• Możliwość tworzenia strategii zależnych od ruchów przeciwnika
2
Dylemat podróznika
• rozszerzenie dylematu więźnia polegające na zwiększeniu liczby
możliwych strategii
Wstęp
Straffin Philip D. Game Theory and Strategy ;
Macy Michael, Flache Alexander, Learning Dynamics in Social
Dilemmas;

Podobne dokumenty