940 likes | 1.11k Vues
高级微观经济学. 东北大学工商管理学院 城市管理与区域经济研究所. 第三章 完全信息动态博弈. 主要内容: 1 、完全信息动态博弈的扩展式表述 2 、扩展式博弈中的纳什均衡 3 、逆向归纳法与子博弈完美纳什均衡 4 、重复博弈与无名氏定理 5 、应用举例. 第三章 完全信息动态博弈. 第三章 完全信息动态博弈. 1 、完全信息动态博弈的扩展式表述 房地产开发博弈: 房地产开发商 A 和 B 考虑是否要开发一栋新的写字楼,如果决定开发必须投入 1 亿资金;
E N D
高级微观经济学 东北大学工商管理学院 城市管理与区域经济研究所
第三章 完全信息动态博弈 主要内容: • 1、完全信息动态博弈的扩展式表述 • 2、扩展式博弈中的纳什均衡 • 3、逆向归纳法与子博弈完美纳什均衡 • 4、重复博弈与无名氏定理 • 5、应用举例
第三章 完全信息动态博弈 1、完全信息动态博弈的扩展式表述 房地产开发博弈: • 房地产开发商A和B考虑是否要开发一栋新的写字楼,如果决定开发必须投入1亿资金; • 假定市场上有两栋楼出售:需求大时,每栋售价1.4亿,需求小时,售价0.7亿; • 如果市场上只有一栋楼:需求大时,可卖1.8亿,需求小时,可卖1.1亿
第三章 完全信息动态博弈 1、完全信息动态博弈的扩展式表述 行动顺序: • (1)A开发商首先决定开发还是不开发; • (2)A决策后,自然选择市场需求的大小; • (3)B在观测到A所选择的行动和市场需求 后,再决定开发还是不开发。
第三章 完全信息动态博弈 1、完全信息动态博弈的扩展式表述 • 开发商博弈的扩展式表述 • 博弈的扩展式表述中包括: 1 参与人集合;2 参与人的行动顺序;3 参与人的行动空间;4 参与人的信息集;5 参与人支付函数;6 自然选择的概率分布等。
参与人(A,B,N) 结,初始结 行动 结,决策结 枝 信息集 结,终点结 支付 第三章 完全信息动态博弈 A 参与人集合 参与人行动顺序 参与人的行动空间 参与人的信息集 参与人的支付函数 外生事件的概率分布 不开发 开发 N N 小 大 小 大 1/2 1/2 1/2 1/2 B B B B 不开发 不开发 不开发 不开发 开发 开发 开发 开发 (4,4) (8,0) (0,0) (-3,-3) (1,0) (0,8) (0,0) (0,1)
第三章 完全信息动态博弈 1、完全信息动态博弈的扩展式表述 • 结:包括决策结和终点结两类;决策结是参与人行动的始点;终点结是决策人行动的终点。 结满足传递性和非对称性 • x之前的所有结的集合,称为x的前列集 P(x),x之后的所有结的集合称为x的后续集T(x)。
第三章 完全信息动态博弈 1、完全信息动态博弈的扩展式表述 • 枝:枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择; • 信息集: 每个信息集是决策结集合的一个子集,该子集包括所有满足下列条件的决策结: 1、每个决策结都是同一个参与人的决策结; 2、该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处于哪一个决策结。
A 不开发 开发 N N 小 大 小 大 1/2 1/2 1/2 1/2 B B B B 不开发 不开发 不开发 不开发 开发 开发 开发 开发 (4,4) (8,0) (0,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) 第三章 完全信息动态博弈 假定:B在决策时不知道自然的选择;知道A的选择 B的信息集由4个变为2个 另外一种情况
A 不开发 开发 N N 小 大 小 大 1/2 1/2 1/2 1/2 B B B B 不开发 不开发 不开发 不开发 开发 开发 开发 开发 (4,4) (8,0) (0,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) 第三章 完全信息动态博弈 B知道自然的选择; 但不知A的选择 或A、B同时决策
第三章 完全信息动态博弈 1、完全信息动态博弈的扩展式表述 信息集的三个假设 • 1、任何一个决策结不能是属于同一信息集的其他决策结的前列结或者后续结; • 2、同一信息集中的所有结都是同一参与人的决策结; • 3、同一参与人在属于同一信息集的每个决策结的行动空间应该是相同的。 博弈结构是参与人的共同知识,每个参与人都可以看到博弈树。
第三章 完全信息动态博弈 1、完全信息动态博弈的扩展式表述 完美信息动态博弈: Perfect information • 完美信息博弈意味着博弈中没有任何两个参与人同时行动,并且所有后行动者能确切地知道前行动者的选择,所有人观测到自然的选择。 • 博弈树中,完美信息意味着没有任何两个决策结是用虚线连起来的。或者说博弈树中所有信息集都是单结的。
第三章 完全信息动态博弈 1、完全信息动态博弈的扩展式表述 • 自然总是假定是单结的,因为自然在参与人决策之后行动等价于自然在参与人之前行动但参与人不能观测到自然的行动。 • 不同的博弈树可以代表相同的博弈,但是有一个基本规则:一个参与人在决策之前知道的事情,必须出现在该参与人决策结之前。
N N A B 小(1/2) 大(1/2) A A 不开发 开发 开发 不开发 B B B B 不开发 不开发 不开发 不开发 开发 开发 开发 开发 (4,4) (8,0) (0,0) (0,8) (0,0) (-3,-3) (1,0) (0,1) 第三章 完全信息动态博弈
A A N B 不开发 开发 N N 小 大 小 大 1/2 1/2 1/2 1/2 B B B B 不开发 不开发 不开发 不开发 开发 开发 开发 开发 (4,4) (8,0) (0,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) 第三章 完全信息动态博弈
第三章 完全信息动态博弈 1、完全信息动态博弈的扩展式表述 思考: • 在房地产开发博弈中,如果B知道N的选择,但不知道A的选择,而A既不知道B也不知道N的选择。如何用扩展式表述该博弈?
A A N B 不开发 开发 N N 小 大 小 大 1/2 1/2 1/2 1/2 B B B B 不开发 不开发 不开发 不开发 开发 开发 开发 开发 (4,4) (8,0) (0,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) 第三章 完全信息动态博弈
N N A B 小(1/2) 大(1/2) A A 不开发 开发 开发 不开发 B B B B 不开发 不开发 不开发 不开发 开发 开发 开发 开发 (4,4) (8,0) (0,0) (0,8) (0,0) (-3,-3) (1,0) (0,1) 第三章 完全信息动态博弈
N N B A 小(1/2) 大(1/2) B B 不开发 开发 开发 不开发 A 不开发 不开发 不开发 不开发 开发 开发 开发 开发 (4,4) (8,0) (0,0) (0,8) (0,0) (-3,-3) (1,0) (0,1) 第三章 完全信息动态博弈
第三章 完全信息动态博弈 1、完全信息动态博弈的扩展式表述 用扩展式表示完全信息静态博弈
第三章 完全信息动态博弈 1、完全信息动态博弈的扩展式表述 用扩展式表示囚徒困境
第三章 完全信息动态博弈 1、完全信息动态博弈的扩展式表述 完美回忆(Perfect recall): • 所有参与人都知道自己以前的选择。 1、同一行动 2、同一信息集
第三章 完全信息动态博弈 2、扩展式表述博弈中的纳什均衡 战略概念的变化 • 战略:参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与人的“相机行动方案”。 • 在静态博弈中,战略和行动是基本相同的。 作为一种行动规则,战略必须是完备的。
A 不开发 开发 B B 不开发 不开发 开发 开发 (-3,-3) (1,0) (0,1) (0, 0) 第三章 完全信息动态博弈 2、扩展式表述博弈中的纳什均衡 战略的概念 A有一个信息集 • 两个可选择的行动, • 战略空间为(开发,不开发) B有两个信息集, • 四个可选择的行动, • B有四个纯战略:
A 不开发 开发 B B 不开发 不开发 开发 开发 (-3,-3) (1,0) (0,1) (0, 0) 第三章 完全信息动态博弈 2、扩展式表述博弈中的纳什均衡 开发策略: • 不论A开发不开发,我开发; 追随策略: • A开发我开发,A不开发我不开发; 对抗策略: • A开发我不开发,A不开发我开发; 不开发策略 • 不论A开发不开发我不开发,
第三章 完全信息动态博弈 2、扩展式表述博弈中的纳什均衡 简写为: • (开发,开发),(开发,不开发) (不开发,开发),(不开发,不开发) • 括号内的第一个元素对应A选择“开发”时B的选择,第二个元素对应A选择“不开发”时B的选择。
第三章 完全信息动态博弈 2、扩展式表述博弈中的纳什均衡 上述博弈的战略式表述为:
第三章 完全信息动态博弈 2、扩展式表述博弈中的纳什均衡 • 存在三个纯战略纳什均衡: (不开发,﹛开发,开发﹜) (开发, ﹛不开发,开发﹜ ) (开发, ﹛不开发,不开发﹜ ) • 两个均衡结果: (开发,不开发) (不开发,开发) • 注意:均衡不同于均衡结果
第三章 完全信息动态博弈 3、逆向归纳法与子博弈完美纳什均衡 • 一个博弈可能有多个(甚至无穷多个)纳什均衡,究竟哪个更合理? • 纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其他参与人的战略是给定的,但是如果参与人的行动有先有后,后行动者的选择空间依赖于先行动者的选择,先行动者在选择时不可能不考虑自己的行动对后行动者的影响。 • 子博弈精练纳什均衡的一个重要改进是将“合理纳什均衡”与“不合理纳什均衡”分开。
A 不开发 开发 B B 不开发 不开发 开发 开发 (-3,-3) (1,0) (0,1) (0, 0) 第三章 完全信息动态博弈 3、逆向归纳法与子博弈完美纳什均衡 • 哪一个均衡更合理 (不开发,﹛开发,开发﹜) (开发,﹛不开发,不开发﹜) (开发,﹛不开发,开发﹜ ) 子博弈精炼纳什均衡
第三章 完全信息动态博弈 3、逆向归纳法与子博弈完美纳什均衡 • 泽尔腾(Selten,1965)引入“子博弈精练纳什均衡”(sub-game perfect Nash equilibrium)的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除,从而给出动态博弈的一个合理的预测结果,简单说,子博弈精练纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。
第三章 完全信息动态博弈 3、逆向归纳法与子博弈完美纳什均衡 • 子博弈:是原博弈的一部分,它本身也可以作为一个独立的博弈进行分析。 • (1)子博弈必须从一个单结信息点开始:只有决策者在原博弈中确切地知道博弈进入一个特定的决策结时,该决策结才能作为一个子博弈的初始结。如果信息集包含两个以上的决策结,则这两个都不可以作为子博弈的初始结。
第三章 完全信息动态博弈 3、逆向归纳法与子博弈完美纳什均衡 • (2)子博弈的信息集和支付向量都直接继承自原博弈,即当x’和x’’在原博弈中属于同一信息集时,他们在子博弈中才属于同一信息集。 • 子博弈不能切割原博弈的信息集。 • 习惯上,任何博弈的本身称为自身的一个子博弈
A 不开发 开发 B B B B 不开发 不开发 不开发 不开发 开发 开发 开发 开发 (-3,-3) (1,0) (0,1) (0, 0) (-3,-3) (1,0) (0,1) (0, 0) 第三章 完全信息动态博弈 3、逆向归纳法与子博弈完美纳什均衡 找出该扩展式博弈的子博弈
第三章 完全信息动态博弈 3、逆向归纳法与子博弈完美纳什均衡 找出该扩展式博弈的子博弈
第三章 完全信息动态博弈 3、逆向归纳法与子博弈完美纳什均衡 练习:
第三章 完全信息动态博弈 3、逆向归纳法与子博弈完美纳什均衡 • 定义:扩展式博弈的战略组合是一个子博弈精练纳什均衡,如果: (1)它是原博弈的纳什均衡; (2)它在每一个子博弈上给出纳什均衡。
第三章 完全信息动态博弈 3、逆向归纳法与子博弈完美纳什均衡 • 如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,这条路径称为“均衡路径”,博弈树上的其他路径称为“非均衡路径”。 • 纳什均衡只要求均衡战略在均衡路径的决策结上是最优的。 • 而构成子博弈精练纳什均衡不仅要求在均衡路径上策略是最优的,而且在非均衡路径上的决策结上也是最优的。这是纳什均衡与子博弈精练纳什均衡的实质区别。
A 不开发 开发 B B B 子博弈1 子博弈2 B 不开发 不开发 不开发 不开发 开发 开发 开发 开发 (-3,-3) (1,0) (0,1) (0, 0) (-3,-3) (1,0) (0,1) (0, 0) 第三章 完全信息动态博弈 3、逆向归纳法与子博弈完美纳什均衡 (不开发,﹛开发,开发﹜) (开发,﹛不开发,不开发﹜) (开发,﹛不开发,开发﹜ ) 只满足子博弈2 只满足子博弈1 满足子博弈1、2
第二章 完全信息动态博弈 3、逆向归纳法与子博弈完美纳什均衡 • 战略是参与人行动规则的完备描述,它要告诉参与人在每一种可预见的情况下(即每一个决策结)上选择什么行动,即使这种情况实际上没有发生(甚至参与人并不预期它会发生)。 • 因此,只有当一个战略规定的行动规则在所有可能的情况下都是最优的,它才是一个合理的可置信的战略,子博弈精练纳什均衡就是要剔除那些只在特定情况下是合理的而在其他情况下不合理的行动规则。
第三章 完全信息动态博弈 3、逆向归纳法与子博弈完美纳什均衡 用逆向归纳法求解子搏弈精练纳什均衡 • 给定博弈达到最后一个决策结,该决策结上行动的参与人有一个最优选择,这个最优选择即该决策结开始的子博弈的纳什均衡; • 回到倒数第二个决策结,找倒数第二个决策者的最优选择,该最优选择与在第一步找到的最优选择构成从倒数第二个决策结开始的子博弈的一个纳什均衡。 • 如此重复直到初始结。每一步都得到对应于子博弈的一个纳什均衡,并且根据定义,该纳什均衡一定是该子博弈的子博弈的纳什均衡,这个过程的最后一步得到整个博弈的纳什均衡
第三章 完全信息动态博弈 3、逆向归纳法与子博弈完美纳什均衡 用逆向归纳法求解子搏弈精练纳什均衡 • 逆向归纳法是求解有限完美信息博弈的最简便方法。因为有限完美信息博弈的每一个决策结都是一个单独的信息集,都开始一个子博弈。
A 不开发 开发 B B 不开发 不开发 开发 开发 (-3,-3) (1,0) (0,1) (0, 0) 第三章 完全信息动态博弈 3、逆向归纳法与子博弈完美纳什均衡 例子 在第二阶段 B最优选择是 ﹛不开发,开发﹜; 在第一阶段A最优选择是 开发; 子博弈精炼纳什均衡: (开发,﹛不开发,开发﹜ )
第三章 完全信息动态博弈 用逆向归纳法求子解搏弈精练纳什均衡 练习:
第三章 完全信息动态博弈 3、逆向归纳法与子博弈完美纳什均衡 • 逆向归纳法是求解有限完美信息博弈的过程,实质上是重复剔除劣战略过程在博弈扩展式上的应用。即从最后一个决策结开始依次剔除掉每个子博弈的劣战略,最后剩下来的战略构成子博弈精炼纳什均衡。 • 要求“所有参与人是理性的”是共同知识。
第三章 完全信息动态博弈 3、逆向归纳法与子博弈完美纳什均衡 • 如果博弈由多个阶段组成,则从逆向归纳法得到的均衡可能并不非常令人信服。 • 有些非完美信息博弈也可以用逆向归纳法的逻辑求解。
第三章 完全信息动态博弈 有唯一的混合战略纳什均衡