N-osobowy dylemat więźnia
Transkrypt
N-osobowy dylemat więźnia
Wstęp N-osobowy dylemat więźnia Krzysztof Balas Jakub Kolecki Politechnika Gdańska 17 listopada 2011 Wstęp Plan prezentacji 1 2 Gra Klasyczny dylemat więźnia • • • • 3 N-osobowy dylemat więźnia • • • • • 4 Historia Opowieść Podejście do problemu Analiza Opis zagadnienia Funkcja charakterystyczna w odniesieniu do dylematu Rozwiązanie i wnioski Przykłady Zastosowania Uogólnienie zagadnienia i wyniki przeprowadzonych eksperymentów Wstęp Eksperyment Stwórzcie 5-osobowe grupy i zagrajcie 10 razy w grę: Decyzja gracza C D ilu pozostałych graczy gra C 0 1 2 3 4 -2 -1 0 1 2 -1 0 1 2 3 Zapisujcie za każdym razem decyzje i wypłaty. Na koniec obliczcie łączne wypłaty wszystkich graczy i dla każdego porównajcie jej wysokość z liczbą przypadków, w których zagrał C. Wstęp Historia Dylemat więźnia wymyślili dwaj pracownicy RAND Corporation: Melvin Dresher i Merrill Flood w 1950 roku. Albert W. Tucker sformalizował jego zasady. Wstęp Opowieść Dwóch podejrzanych zostało zatrzymanych przez policję. Policja, nie mając wystarczających dowodów do postawienia zarzutów, rozdziela więźniów i przedstawia każdemu z nich tę samą ofertę: jeśli będzie zeznawać przeciwko drugiemu, a drugi będzie milczeć, to zeznający wyjdzie na wolność, a milczący dostanie dziesięcioletni wyrok. Jeśli obaj będą milczeć, obaj odsiedzą 6 miesięcy za inne przewinienia. Jeśli obaj będą zeznawać, obaj dostaną pięcioletnie wyroki. Każdy z nich musi podjąć decyzję niezależnie i żaden nie dowie się czy drugi milczy czy zeznaje, aż do momentu wydania wyroku. Jak powinni postąpić? Wstęp Podejście do problemu Możliwe wyniki gry: Więzień A milczy Więzień A zeznaje Więzień B milczy Obaj skazani na 6 miesięcy Więzień A: wolny, Więzień B: 10 lat Więzień B zeznaje Więzień A: 10 lat, Więzień B: wolny Obaj skazani na 5 lat Wstęp Przykładowa macierz wypłat: Współpracuj Oszukuj Współpracuj 3,3 5,0 Oszukuj 0,5 1,1 Wstęp Analiza Ogólna postać dylematu: Współpracuj Oszukuj Współpracuj R,R T,S Oszukuj S,T P,P gdzie: T- pokusa zdrady R- nagroda za współpracę P- kara za zdradę S- wypłata oszukanego T >R>P>S (1) Wstęp Analiza: Równowaga Nasha Oszukuj jest strategią ściśle dominującą: niezależnie od tego co robi przeciwnik, zawsze bardziej opłaca się oszukiwać niż współpracować. Racjonalny gracz będzie tylko oszukiwał i jedyną równowagą Nasha jest punkt (Oszukuj, Oszukuj). W efekcie obaj zyskają mniej, niż gdyby obaj współpracowali. Wstęp N-osobowy dylemat więźnia N-osobowym dylematem więźnia nazywamy każdą grę, w której każdy z N graczy ma dwie strategie. Jedna z nich jest ściśle dominująca, lecz jeżeli wszyscy gracze wybiorą tą strategię to uzyskają niższe wypłaty, niż wybierając strategię zdominowaną. Wstęp Gra 3-osobowa Rysunek: Tabela wypłat dla 3-osobowego dylematu więźnia • Gra symetryczna • Strategia D dominuje C dla każdego gracza • DDD - punkt równowagi • CCC dominuje DDD w sensie Pareto Wstęp Gra 3-osobowa • N = 3 > 2 pozawala na nawiązywanie współpracy: Rysunek: Tabela wypłat przy koalicji Kolumny i Warstwy • gra posiada punkt siodłowy Wstęp Gra w postaci funkcji charakterystycznej Grą w postaci funkcji charakterystycznej nazywamy grę opisywaną przez N - zbiór graczy oraz ν : 2N → R. ν(S) określa łączną wygraną koalicji S (zakładamy, że S gra najoptymalniej, w najmniej korzystnych warunkach). Grę nazywamy superaddytywną, jeżeli ν(S ∪ T ) ≥ ν(S) + ν(T ) Wstęp Gra 3-osobowa Funkcje charakterystyczna związana z opisywanym przypadkiem przyjmuje następujące wartości: ν(∅) = 0 ν(W ) = ν(K ) = ν(L) = −1 ν(WK ) = ν(WL) = ν(KL) = 3 ν(WKL) = 0 Wstęp Wnioski z dylematu więźnia • Wnioski cięgnięte z funkcji charakterystycznych mogą być mylące • Dążenie do współpracy w niektórych sytuacjach bywa ryzykowne • Najcenniejszą cechą jest oportunizm, cnota może być karana Powyższe wniostki dotyczą N-osobowej wersji gry o sumie niezerowej i jej funkcji charakterystycznej. Wstęp Przykład z pastuszkami Wyobraźmy sobie grupę farmerów użytkujących wspólne pastwisko. Każdy z nich zastanawia się czy nie wypasać dodatkowej krowy. Korzyścią będzie dochód przynoszony przez kolejną krowę. Strata wynika z tego, że nadmiernie eksploatowane pastwisko może ograniczyć swą produktywność. Jest to strata, która rozłoży się po równo na wszystkich i każdy z nich straci na tym niewiele. Ponieważ korzyść odniesiona przez pojedynczego farmera jest większa niż jego strata, racjonalne postępowanie polega na wypasaniu większej liczby krów. Podobnie postępują inni farmerzy i w końcu nadmiernie eksploatowane pastwisko przestaje komukolwiek przynosić korzyści. Wstęp Przykladowa macierz wypłat: Liczba krów 10 11 12 13 14 15 16 17 18 19 20 Zysk z jednej 1000 900 800 700 600 500 400 300 200 100 0 Zysk łącznie 10000 9900 9600 9100 8400 7500 6400 5100 3600 1900 0 Wstęp Odniesienie do rzeczywistości Interakcje w społeczeństwie jak i w przyrodzie charakteryzują się podobnymi wypłatami jak w dylemacie więźnia. 1 Nauki społeczne • Ekonomia • Polityka • Socjologia Wstęp Odniesienie do rzeczywistości Interakcje w społeczeństwie jak i w przyrodzie charakteryzują się podobnymi wypłatami jak w dylemacie więźnia. 1 Nauki społeczne • Ekonomia • Polityka • Socjologia 2 Nauki biologiczne • Etologia (zachowania zwierząt) • Biologia ewolucyjna (pochodzenie gatunków) Wstęp Przykłady z życia 1 Politologia • Wyścig zbrojeń Wstęp Przykłady z życia 1 Politologia • Wyścig zbrojeń 2 Demografia • Przeludnienie Wstęp Przykłady z życia 1 Politologia • Wyścig zbrojeń 2 Demografia • Przeludnienie 3 Środowisko • Wyczerpywanie się zapasów naturalnych • Zanieczyszczenie środowiska Wstęp Przykłady z życia 1 Politologia • Wyścig zbrojeń 2 Demografia • Przeludnienie 3 Środowisko • Wyczerpywanie się zapasów naturalnych • Zanieczyszczenie środowiska 4 Sport • Kolarstwo • Gwałtowne tracenie wagi • Doping Wstęp Przykłady z życia 1 Politologia • Wyścig zbrojeń 2 Demografia • Przeludnienie 3 Środowisko • Wyczerpywanie się zapasów naturalnych • Zanieczyszczenie środowiska 4 Sport • Kolarstwo • Gwałtowne tracenie wagi • Doping 5 Rozrywka • Wstawanie z miejsc w czasie koncertu rockowego Wstęp Znaczenie zjawiska Model n-osobowego Dylematu Więźnia ma zasadnicze znaczenie dla rozważań nad problemami gospodarczymi. Rozwiązaniem takich problemów może być zgoda wszystkich na zbiorowy przymus. Byłoby to dla wszystkich przymuszanych opłacalnym wyjściem. Wstęp Uogólnienia i przeprowadzone eksperymenty • Wyniki naszej gry: kooperator grupa kooperatorów -5,7 grupa indywidualistów • Udowodniono, że więźniowie ”uczą się” dezerter 4,4 -3,7 • Wartości wypłat przy nieskończonej liczbie iteracji rosną do ustalonego poziomu Wstęp Uogólnienia zagadnienia 1 Iterowany dylemat więźnia • Wielokrotne rozegranie gry z jednym przeciwnikiem • Możliwość tworzenia strategii zależnych od ruchów przeciwnika 2 Dylemat podróznika • rozszerzenie dylematu więźnia polegające na zwiększeniu liczby możliwych strategii Wstęp Straffin Philip D. Game Theory and Strategy ; Macy Michael, Flache Alexander, Learning Dynamics in Social Dilemmas;