240 likes | 434 Vues
管中窥豹. 说. 博 弈. 要想在现代社会做个有价值的人 , 你就必须对博弈论有个大致的了解。 —— 保罗 . 萨缪尔逊. 一、什么是博弈论?. 1 、通俗的理解. 从汉字的理解看: 博是广泛、丰富的意思,也是古代的一种棋戏,弈是指围棋、下棋的意思,这样理解 “ 博弈论 ” 也就是下棋的理论。 从英文的理解看: 博弈论的英文翻译是 Game Theory , Game 是游戏, Theory 是理论,也就是外国人的理解是游戏的理论。. 生活中,博弈无孔不入、无处不在。. 2 、研究博弈论的历史.
E N D
管中窥豹 说 博 弈 要想在现代社会做个有价值的人,你就必须对博弈论有个大致的了解。 ——保罗.萨缪尔逊
1、通俗的理解 • 从汉字的理解看:博是广泛、丰富的意思,也是古代的一种棋戏,弈是指围棋、下棋的意思,这样理解“博弈论”也就是下棋的理论。 • 从英文的理解看:博弈论的英文翻译是Game Theory,Game 是游戏,Theory是理论,也就是外国人的理解是游戏的理论。
2、研究博弈论的历史 • 对博弈论的研究,开始于策墨洛(Zermelo,1913)、波雷尔(Borel,1921)及冯·诺伊曼(von Neumann, 1928),后来由冯·诺伊曼和奥斯卡·摩根斯坦(von Neumann and Morgenstern,1944,1947)首次对其系统化和形式化(参照Myerson, 1991)。 冯•诺伊曼和他的著作
随后约翰·福布斯·纳什(John Forbes Nash Jr., 1950, 1951)利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚实的基础。1994年约翰·福布斯·纳什、约翰·C·海萨尼以及莱因哈德·泽尔腾,三人同时因为他们对博弈论的研究,所作出的突出贡献,而获得诺贝尔经济学奖。 John Nash John Harsany Leihaden Selten
3、学术上的定义。 • 博弈论(Game Theory),是研究理性的决策主体在其行为发生直接的相互作用时的策略选择及策略均衡的理论。它是应用数学的一个分支,也是运筹学的一个重要学科,是研究具有斗争或竞争性质现象的理论和方法。博弈分析的关键步骤是找出在面对竞争时自己的最佳反应策略(给自己带来最大收益的策略)。
二、学习博弈的意义何在? • 人生,就是由一局又一局的博弈所组成,我们学习就是要通过这种思考,来指导面对竞争如何更加系统的提出合理的策略,从而达到取得胜利的目的。 我的天鹅!我的鱼……
三、“智猪博弈”案例 • 猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,而猪圈的另一边有一个投食口,在每踩一下踏板,投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会,抢先吃到落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前,吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完之前,跑到食槽,抢到一半残羹。
结果是:小猪肯定会选择“搭便车”策略,而大猪不得不去踩踏板,为一点残羹,不知疲倦地奔波于踏板和食槽之间。结果是:小猪肯定会选择“搭便车”策略,而大猪不得不去踩踏板,为一点残羹,不知疲倦地奔波于踏板和食槽之间。 我去踩,一口都没有,我才不去踩呢! 小样,肯定不会去踩,我踩,能吃一半,不踩,铁定饿肚子,唉,没办法只能亲自动脚了!
决定大猪、小猪策略的核心指标:每次落下的食物数量和踏板与投食口之间的距离。决定大猪、小猪策略的核心指标:每次落下的食物数量和踏板与投食口之间的距离。 • 改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。 • 改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。 • 改变方案三:减量并且移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。
1、启发: • 它给弱者的启发是:为了生活,在争不赢别人的情况下,作为弱者就要想办法去寻找一个适合自己的环境,想办法去 “搭便车”。 • 它给强者的启发是:我必要要维护自己的知识产权和劳动价值,不能老是做冤大头,必须得找一个能够实现自己价值的地方工作。 • 它给政府的启发是:不同的分配方案会导致不同的结果,要实现社会资源的有效配置,实现经济社会的和谐反展,必须要制定一套合理游戏规则,使得所有的人都能最大限度的发挥自己能力,让大家都去尽力创造财富,同时也要完善社保制度,保护弱势群体的利益,在保障效率的同时兼顾公平。
2、通过案例看博弈论知识: • (1)局中人:在一场竞赛或博弈中,每一个有决策权的参与者就是一个局中人,也就是参与人。 • (2)策略:一局博弈中,每个局中人都可以选择实际可行的完整的行动方案,一个可行的、自始至终的、全局筹划的行动方案,称之为一个策略。 • (3)得失:一局博弈结局时的结果称为得失。一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付函数。 • (4)次序:局中人的决策有先后顺序。 • (5)均衡:均衡是平衡的意思,在经济学中,均衡意思就是相关量处于稳定值。
四、“囚徒困境博弈”案例 “囚徒困境”博弈的支付矩阵:
如果您是囚徒你会怎么办? 我坦白,李四那家伙肯定靠不住,肯定顶不住只监禁三个月的诱惑,会出卖我,到时候我就成了冤大头,十年的牢狱之灾啊!况且如果李四讲义气的话,我坦白,我只是监禁三个月,为什么不呢?大不了两败俱伤,五年也比十年好啊! • 结果是:两人都选择坦白的策略,因此都被判了5年监禁。这个的结局被称为“纳什均衡”。 这小子,为人我清楚,八成顶不住,我不坦白就惨了!
1、“囚徒困境”的思考: • 个人利益与集体利益的思考:在“囚徒困境”的博弈当中,每个人都会选择个人利益,而不顾他人利益和集体利益,最终利己行为,导致了“纳什均衡”的形成,结局对双方都不利。既损人又害己,所以在我们的日常生活中,面对个人利益与集体利益的博弈的时候,我们或许应该多一点超出理性的思考,以集体利益为重。如果大家都这样想的话,不管是集体利益还是个人利益,都会实现最大化 。
经济学的思考:“囚徒困境”的博弈亚当·斯密的完全自由竞争市场能够实现社会利用最大化的理论,提出了挑战,政府宏观调控这只“看的见的手”呼之欲出。经济学的思考:“囚徒困境”的博弈亚当·斯密的完全自由竞争市场能够实现社会利用最大化的理论,提出了挑战,政府宏观调控这只“看的见的手”呼之欲出。 • 合作的思考:博弈学专家艾克斯罗德,通过计算机设计了这个程序,并且邀请不同的人做试验,经过几百次的试验,最终得出了结果,结果是大家最终选择合作,当然不是每次都合作,但是合作次数比不合作次数的多。 “囚徒困境”多次博弈后的,最优解决方案是合作。
2、通过案例看博弈论知识: • 首先,是“纳什均衡”,是指一局博弈中,局中人都从自己的利益最大化来选择策略,所共同形成的策略组合,最终实现的均衡。 • 其次,是博弈的分类,根据有没有条约约束,博弈主要可以分为合作博弈和非合作博弈;根据行为的时间序列性,可分为静态博弈和动态博弈;根据结果不同,分为零和博弈和变和博弈。