1 / 34

DMBO

DMBO. Dualność i gry. Problem pakowania plecaka – ilustracja dualności. Złodziej napada na magazyn z plecakiem . Plecak nie może być zbyt ciężki , bo złodziej go nie uniesie . W magazynie znajduje się dużo dobrze podzielnych towarów np . złoto , srebro , pył diamentowy .

sibley
Télécharger la présentation

DMBO

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. DMBO Dualność i gry

  2. Problem pakowaniaplecaka – ilustracjadualności • Złodziejnapadanamagazyn z plecakiem. • Plecakniemożebyćzbytciężki, bozłodziej go nieuniesie. • W magazynieznajdujesiędużodobrzepodzielnychtowarównp. złoto, srebro, pyłdiamentowy. • Złodziejchcezapełnićplecaknajbardziejcennymitowarami. Jakzdecydujeco wziąć do plecaka?

  3. Model • Parametry: W – maksymalnawagaplecaka N – ilośćtowarów w magazynie wi – waga dobra i vi – wartość dobra i • Zmiennedecyzyjne: xi – jakdużotowaru i włożyć do plecaka (udziałcałościtego co jest w magazynie) • Funkcjacelu: Maksymalizujwartośćtowarów • Ograniczenia: (a) Złodziejniemożewziąćwięcejdanegotowaruniż jest w magazynie. • Złodziejnieuniesiewięcejniżplecak i siłypozwolą. • Złodziejniemożeukraśćujemnejilościtowarów (jeśli jest złodziejem)

  4. Model • Problem możnazatemsformułowaćjako ZPL: Max

  5. Przykładproblemuprymalnego: Problem złodzieja • Podstawmy N=3, W=4, w=(2,3,4) i v=(5,20,3) złoto, diamenty i srebro. max p.w. Rozwiązanieproblemuzłodzieja: (x1,x2,x3)=(0.5, 1, 0) Wartośćfunkcjicelu: 22.5

  6. Analiza • Tylkojedentowar (złoto) jest wybrany w częściułamkowej. Jest to ogólnazasada w problemach z pakowaniemplecaka z N towarami. • Intuicja: • Optymalnerozwiązanie w tymprzykładzie jest jednoznaczne. • Abyjednoznaczniewyznaczyć3 niewiadome, potrzebujemy 3 równanialiniowe. • Czyliprzynajmniej 3 naszeograniczeniamusząbyćspełnionew postacirówności. • Jednoograniczenie to wagaplecaka, ale pozostałedwadotycząilościtowarów 0≤xi≤1. • Zatemtylkojedentowarmożebyćwybrany w postaciułamkowej w optimum.

  7. Syndykwykupujezłodzieja • Przypuśćmy, żesyndykatprzestępczychcewykupićskradzionetowary od złodzieja. • Proponująceny y1zazłoto, y2zadiamenty, y3zasrebrooraz y4za kilogram plecaka. • Ale złodziejmożeużyć 2 kilogramypojemnościplecaka i całeswojezłoto, abywygenerowaćzysk 5 jednostek, czyli 2y4+y1powinnowynosićprzynajmniej 5. Podobnie w przypadkupozostałychtowarów. • Syndykatchciałbyzminimalizowaćcałkowitącenę, którąpłacizłodziejowi y1+y2+y3+4y4 • Cenypowinnybyćnieujemne, inaczejzłodziejniesprzedatowarów i plecaka.

  8. Przykładproblemudualnego: Problem syndyka • Problem syndykamożnazatemprzedstawićnastępująco: min p.w. Rozwiązanieproblemusyndyka: (y1,y2,y3,y4)=(0,12.5,0,2.5) Optymalnawartośćfunkcjicelu: 22.5

  9. Problem złodzieja: Jest równoważny: Ponieważ np. Przekształcamy: Ponieważ np. To jest równoważny problemowi syndyka:

  10. Rozwiązanieproblemusyndyka: (y1,y2,y3,y4)=(0,12.5,0,2.5) cenydualne Optymalnawartośćfunkcjicelu: 22.5 Rozwiązanieproblemuzłodzieja: (x1,x2,x3)=(0.5, 1, 0) Optymalnawartośćfunkcjicelu: 22.5

  11. Rozwiązanieproblemusyndyka: (y1,y2,y3,y4)=(0,12.5,0,2.5) cenydualne Optymalnawartośćfunkcjicelu: 22.5 Rozwiązanieproblemuzłodzieja: (x1,x2,x3)=(0.5, 1, 0) Optymalnawartośćfunkcjicelu: 22.5

  12. Gry o sumie zerowej • W grach o sumie zerowej wypłaty sumują się do zera w każdym stanie • Diagram przesunięć

  13. Gry o sumie zerowej • Minimax = maximin = wartość gry • Gra może mieć wiele punktów siodłowych

  14. Gry o sumie zerowej • Albo nie mieć ich wcale • Jaka jest wartość gry w takim przypadku? • Jeśli gra nie ma punktu siodłowego, trzeba wprowadzić strategie mieszane

  15. Gry o sumie zerowej • Jeśli jest więcej niż dwie strategie dla jednego gracza i gra nie ma punktu siodłowego, nie wiadomo, które strategie będą częścią optymalnej strategii mieszanej • Niech mieszana strategia Kolumny będzie (x,1-x) • Wypłata Wiersza dla każdej jego strategii

  16. Gry o sumie zerowej • Kolumna będzie wybierała x, aby zmaksymalizować „górną kopertę” (upperenvelope)

  17. Gry o sumie zerowej • Przekształcamy w problem programowania liniowego

  18. Studium przypadku: Teoria gier i dualność • W latach pięćdziesiątych, Davenport studiował zachowanie rybaków w małej wiosce na Jamajce.

  19. Twenty-six fishing crews in sailing, dugout canoes fish this area [fishing grounds extend outward from shore about 22 miles] by setting fish pots, which are drawn and reset, weather and sea permitting, on three regular fishing days each week … The fishing grounds are divided into inside and outside banks. The inside banks lie from 5-15 miles offshore, while the outside banks all lie beyond … Because of special underwater contours and the location of one prominent headland, very strong currents set across the outside banks at frequent intervals … These currents are not related in any apparent way to weather and sea conditions of the local region. The inside banks are almost fully protected from the currents. [Davenport 1960]

  20. Jamajka

  21. Strategie 26 drewnianych kanoe. Kapitanowie tych kanoe mają do dyspozycji 3 strategie połowu: • IN – ustawić wszystkie kosze w zatokach • OUT – ustawić wszystkie kosze na wodach odsłoniętych • IN-OUT– część koszy w zatokach część na zewnątrz

  22. Zalety i wady połowu na otwartym morzu WADY • Dopłynięcie do łowiska zabiera więcej czasu, więc można postawić mniej koszy • Jak prąd jest aktywny, powoduje duże zagrożenie dla koszy ustawionych na otwartym morzu • Znosi znaczniki • Uszkadza kosze podczas przesuwania • Zmiany temperatury wody mogą zabijać ryby wewnątrz koszy ZALETY • Ryby na łowiskach zewnętrznych są dużo lepszej jakości • Jeśli jest ich dosyć, mogą wyprzeć ryby z łowisk wewnętrznych zupełnie z rynku • Rybołóstwo na łowiskach zewnętrznych wymaga dużo lepszych kanoe • Zazwyczaj ci, którzy łowią na łowiskach wewnętrznych kupują używane kanoe od tych, którzy łowią na łowiskach zewnętrznych • Posiadanie lepszych kanoe daje dużo prestiżu, ponieważ ich kapitanowie dominują w corocznych wyścigach kanoe

  23. Dane • Davenport zebrał dane dotyczące średnich dziennych zysków w zależności od strategii połowu oraz obecności/nieobecności prądu

  24. Strategia OUT

  25. 1 Gra o sumie zerowej?? • Nie ma punktu siodłowego • Strategia mieszana – załóżmy, że „złośliwy” prąd „stosuje” strategię „Płynę” z prawdopodobieństwem p1, „Nie płynę” z prawdopodobieństwem p2 • Strategia rybaków: IN z prawd. q1, OUT z prawd. q2, IN-OUT z prawd. Q3 • Dla każdego p rybacy wybierają strategię (q) z maksymalną wypłatą • A „złośliwy” prąd wybiera p tak, aby rybacy zarobili jak najmniej

  26. Rozwiązanie graficzne problemu prądu Solution: p=0.31 Optymalna strategia mieszana prądu

  27. Podobnie w przypadku odwrotnym: • Dla każdej strategii rybaków q, prąd „wybiera” taką, dla której rybacy zarobią najmniej: • Rybacy natomiast będą się starali tak wybrać q, aby zmaksymalizować swoją wypłatę

  28. Maxmin i minimax

  29. Raportwrażliwościminimax

  30. Raportwrażliwościmaximin

  31. Prognoza i obserwacja Gra o sumie zerowej Obserwacja Nikt nie ryzykuje zastawiania koszy na zewnętrznych łowiskach Strategia rybaków: 69% IN, 31% IN-OUT [Oczekiwana wypłata: 13.38] Prąd: 25% PŁYNIE, 75% NIE PŁYNIE • Nikt nie ryzykuje zastawiania koszy na zewnętrznych łowiskach • Optymalna strategia rybaków: 67% IN, 33% IN-OUT [Oczekiwana wypłata: 13.31] • Optymalna strategia prądu: 31% PŁYNIE, 69% NIE PŁYNIE Konkluzja Davenporta: rybacy są dobrze przystosowani Odkrycie Davenporta przez parę lat nie zostało zakwestionowane aż do momentu …

  32. Prąd nie jest złośliwy • Kozelka 1969 oraz Read, Read 1970 zauważyli, że • Prąd nie dostosowuje swojej „strategii” do działań rybaków • Dlatego rybacy powinni zastosować zasadę oczekiwanych zysków • Oczekiwane zyski rybaków • IN: 0.25 x 17.3 + 0.75 x 11.5 = 12.95 • OUT: 0.25 x (-4.4) + 0.75 x 20.6 = 14.35 • IN-OUT: 0.25 x 5.2 + 0.75 x 17.0 = 14.05 • Czyli wszyscy rybacy powinni łowić na zewnętrznych łowiskach • Może jednak nie są zbyt dobrze przystosowani

  33. Prąd może być jednak złośliwy • Prąd nie rozumuje, ale łowienie na otwartym morzu jest bardzo ryzykowne. • Nawet jeśli prąd płynie ŚREDNIO 25% czasu, to jednak może płynąć częściej w danym roku. • Załóżmy, że w jednym roku prąd płynie 35% czasu. Oczekiwana wypłata: • IN: 0.35 x 17.3 + 0.65 x 11.5 = 13.53 • OUT: 0.35 x (-4.4) + 0.65 x 11.5 = 11.85 • IN-OUT: 0.35 x 5.2 + 0.65 x 17.0 = 12.87. • Poprzez potraktowanie prądu jak złośliwego gracza rybacy GWARANTUJĄ sobie wypłatę przynajmniej 13.31, niezależnie od tego, jak często płynie prąd • Rybacy płacą $1.05 składki ubezpieczeniowej

  34. Skojarzenia http://mathsite.math.berkeley.edu/smp/smp.html

More Related