1 / 30

Gry w postaci ekstensywnej

Gry w postaci ekstensywnej. Wykład 5. Trzy firmy. Równowaga indukcji wstecznej: ( OUT ; OUT ; AAF ) Jest jednak dużo więcej równowag Nasha , na przykład ( IN ; IN ; AFA ) – niewiarygodna groźba Tesco. Forma standardowa. Dr Strangelove.

lei
Télécharger la présentation

Gry w postaci ekstensywnej

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Gry w postaciekstensywnej Wykład 5

  2. Trzy firmy • Równowaga indukcji wstecznej: (OUT; OUT; AAF) • Jest jednak dużo więcej równowag Nasha, na przykład • (IN;IN; AFA) – niewiarygodna groźba Tesco.

  3. Forma standardowa

  4. Dr Strangelove • Komandor floty powietrznej Stanów Zjednoczonych rozkazuje 34 B-52, aby rozpocząć nuklearny atak na Związek Radziecki • Zamyka wszystkie kanały komunikacji z bazą i samolotami • Amerykański prezydent zaprasza rosyjskiego ambasadora do war room i wyjaśnia sytuację • Decydują się zadzwonić do rosyjskiego premiera Dimitrija

  5. Dr Strangelove • Co jest wynikiem jeśli Stany Zjednoczone nie wiedzą o istnieniu doomsdaydevice? • Co jest wynikiem jeśli wiedzą? • Zobowiązanie (commitment) musi być obserwowalne • Co jeśli Związek Sowiecki może zdezaktywować urządzenie? • Zobowiązanie musi być nieodwracalne Thomas Schelling: Thepower to constrain an adversarydepends upon thepower to bind oneself

  6. Wiarygodne zobowiązania (groźby) • W sytuacjach nie-strategicznych więcej opcji nigdy nie zaszkodzi • Tak nie jest w sytuacjach strategicznych • Można zmienić działanie swojego przeciwnika eliminując niektóre swoje opcje działania

  7. Przykłady • 1066: William Zdobywca rozkazał swoim żołnierzom spalić statki po wylądowaniu, aby uniemożliwić im odwrót • 1519: HernanCortes zatopił swoje statki po wylądowaniu w Meksyku z tego samego powodu • Sun-tzu w Theart of war, 400 przed Chrystusem: Atthecritical moment, the leader of an armyactslike one whohasclimbedup a height, and thenkicksawaytheladderbehindhim

  8. Skarb piratów • 5 racjonalnych piratów Adam, Bogdan, Czesio, Dzidek i Eustachy znajdują wielką skrzynię ze skarbem a w niej 200 sztuk złota. • Piraci mają ścisły porządek starszeństwa odpowiadający przeszłym zasługom i sile: Adam jest nad Bogdanem, Bogdan nad Czesiem, Czesio nad Dzidkiem a Dzidek nad Eustachym. • Najpierw Adam proponuje jak rozdzielić 200 sztuk złota między pozostałych • Wszyscy piraci głosują demokratycznie • Jeśli większość zaakceptuje – propozycja przechodzi • Jeśli większość odrzuci – zabijają Adama i następny w kolejności pirat proponuje podział

  9. Skarb piratów Gra sekwencyjna – znajdziemy SPNE poprzez indukcję wsteczną: 4 krok:zostało tylko dwóch piratów, Dzidek przydziela sobie cały skarb – remis, propozycja przechodzi 3 krok: zostało trzech piratów, Czesio proponuje – nie może dać Dzidkowi więcej niż miał, ale może dać Eustachemu

  10. Skarb piratów 2 krok: czterech piratów zostało, Bogdan musi przekonać przynajmniej jednego – najlepiej Dzidka

  11. Skarb piratów 1 krok: pięciu piratów zostało, Adam nie przekona Bodzia, ale może przekonać Czesia i Eustachego

  12. Gry w formie ekstensywnej (drzewo) vs gry w formie strategicznej (tabelka) • Gra w postaci strategicznej składa się z: • Zbiór graczy • Dla każdego gracza: • Zbiór akcji • Funkcja wypłat dla każdego profilu akcji • Gry w postaci ekstensywnej zawierają więcej informacji: • Kolejność ruchów • Akcje, które mają do dyspozycji gracze na różnych etapach gry • Informacja dostępna dla graczy podczas gry

  13. Drzewo – graf acykliczny • Wierzchołki: • Wierzchołki decyzyjne oraz losowe • Korzeń i liście • Krawędzie (gałęzie) • Etykiety graczy • Etykiety akcji • Wypłaty • Zbiory informacji

  14. Strategie w grach ekstensywnych • Strategia czysta gracza jest to plan akcji w każdym wierzchołku decyzyjnym tego gracza • W równowadze indukcji wstecznej każdy gracz gra optymalnie w każdym wierzchołku decyzyjnym (gra sekwencyjnie racjonalną strategię) • Równowaga a wynik gry w równowadze

  15. Innyprzykład • Kodak zastanawiasię, czywejśćnarynekfotografiinatychmiastowej a Polaroid zastanawiasięczywalczyćczysięzgodzić

  16. Analiza • ZbiórrównowagNasha = {(In, A), (Out,F)} • (Out, F) jest opartenaniewiarygodnejgroźbiePolaroida • RównowagaindukcjiwstecznejeliminujerównowagiNasha, któresąopartenaniewiarygodnejgroźbie. • RównowagaNashawymagaracjonalności • Równowagaindukcjiwstecznejwymagaracjonalnościsekwencyjnej • Graczemuszągraćoptymalnie w każdympunkciegry

  17. Gra w formie ekstensywnej z niedoskonałą informacją Nie możemy zastosować indukcji wstecznej, ponieważ K nie może znaleźć optymalnej strategii znajdując się w zbiorze informacji, który zawiera dwa wierzchołki

  18. SubgameperfectEquilibrium • Podgra to część drzewa gry taka, że: • Zaczyna się od pojedynczego wierzchołka decyzyjnego • Zawiera każdy następnik tego wierzchołka • Jeśli zawiera jakiś wierzchołek w zbiorze informacji, wtedy zawiera wszystkie wierzchołki w tym zbiorze informacji Jetpodgrą Nie jest podgrą

  19. SubgamePerfectNashEquilibrium • Czysta strategia gracza to plan akcji w każdym zbiorze informacji tego gracza • Profil strategii jest SPNE jeśli w każdej podgrze jest równowagą Nasha

  20. Bank run

  21. Panika finansowa • Dwóch inwestorów – każdy z nich zdeponował sumę D w banku. • Bank zainwestował w długoterminowy projekt. • Jeśli bank będzie zmuszony upłynnić inwestycję przed terminem zapadalności, wówczas będzie w stanie odzyskać tylko 2r, gdzie D>r>D/2 • Jeśli inwestycja „dotrwa” do końca, wypłata będzie równa 2R, gdzie R>D • Są dwa okresy, w których inwestorzy mogą wycofać swój wkład: • Okres 1, przed okresem zapadalności inwestycji • Okres 2, po okresie zapadalności • Nie ma dyskontowania

  22. Niestandardowy sposób reprezentacji gry OKRES 1 • Jeśli oboje wypłacą, każdy otrzyma r • Jeśli jeden wypłaci a drugi nie, to ten pierwszy otrzyma D a drugi 2r-D i gra się kończy • Jeśli nikt nie wypłaci, wówczas przechodzimy do kolejnego etapu OKRES 2 • Jeśli oboje wypłacą, każdy otrzyma R • Jeśli jeden wypłaci a drugi nie, to ten pierwszy otrzyma 2R-D a drugi D • Jeśli żaden nie wypłaci, wówczas bank zwraca każdemu R R>D>r>D/2

  23. Rozwiązujemy od tyłu OKRES 2 • Ponieważ R>D, “wypłaca” ściśle dominuje “nie wypł.”, dlatego (wypłaca, wypłaca) jest równowagą w strategiach ściśle dominuj. OKRES 1 • Nie ma dyskontowania, więc po prostu wstawiamy (R,R) • Dwie równowagi Nasha: • (nie wypł. nie wypł.) z wypłatą (R,R) • (wypłaca, wypłaca) z wypłatą (r,r) [panika finansowa] R>D>r>D/2

  24. RównowagainduckjiwstecznejvsSPNE • Równowagaindukcjiwstecznejwystępuje w grachdynamicznych z doskonałąinformacją • SPNEbardziejogólna– takżedlagier z niedoskonałąinformacją • Od terazniebędęrobiłrozróżnienia, tylkobędęzawszemówił SPNE

  25. Gra ultimatum • Gracz 1 proponuje podział 100 złotych (liczonych w dziesiątkach) • Gracz 2 akceptuje podział – każdy dostaje to co przewiduje podział, lub odrzuca – wtedy 100 złotych przepada • Jakie gracze mają strategie? Ile ich jest? • Co jest równowagą SPNE? Ile ich jest?

  26. Gra ultimatum • Jedyne równowagi SPNE to • (0, AAAAAAAAAAA) • (1,OAAAAAAAAAA)

  27. Gra ultimatum • (5,OOOOOAAAAAA) jest równowagą Nasha (czemu?), ale groźba gracza drugiego, że odrzuci wszystko poniżej 50 złotych jest niewiarygodna, nie jest SPNE ponieważ nie jest optymalna w drugiej podgrze. • Ile jest równowag Nasha?

  28. Stonoga (Centipede) Co jest równowagą indukcji wstecznej? Krytyka: Jakiego rodzaju racjonalność jest wymagana?

  29. Gry statyczne vs gry dynamiczne • Gry statyczne • Gracze ruszają się jednocześnie • Wybierają jedną akcję • Równowaga Nasha – profil akcji (jedna akcja najlepszej odpowiedzi dla każdego gracza • Gry dynamiczne • Gracze ruszają się sekwencyjnie • Wybierają jedną akcję w każdym swoim zbiorze informacyjnym • SPNE – profil strategii (jedna strategia najlepszej odpowiedzi w każdej podgrze dla każdego gracza

More Related