对策论 ( 一 )

对策论(一) 刘志新 2003.10.21

主要内容 • 1.基本概念 • 2.二人零和有限对策 • 3.二人非零和有限对策 • 4.二人零和无限对策

基本概念 • 1.对策论 • 2.局中人:决策的主体 • 3.支付:局中人从对策中获得的利益 • 4.行动:局中人在某时点上的决策变量 • 5.战略:局中人的行动规则 • 6.支付函数

基本概念 • 7.合作对策&非合作对策 • 8.两人对策&多人对策 • 9.零和对策&常和对策&变和对策 • 10.静态对策&动态对策&重复对策 • 11.完全信息对策&不完全信息对策

一个例子 • 囚徒困境

研究对策论常用的两种模型 • (一)展开型 • (二)正规型

展开型对策 • 例:

展开型对策 • 定义1:有n个局中人的对策树是指具有以下性质的三元组 ,使得: 为树,且为一映射, 为局中人的集合为一映射

展开型对策 • 定义2:设为对策树,称为由产生的n人对策,对策也称为展开型对策. • 定义3:在对策中,设有策略组使对于任何的及均有: ,则称为对策的一个平衡点. .

展开型对策 • 定理:设为对策树,则有一个平衡点

正规型对策 • 定义1:给定三元组其中均为集合,而是定义在上的实值函数,则称为一个对策. • 定义2:若有策略 ,使称为甲的保守策略..

正规型对策 • 定义3:若有满足: 则称策略对为对策的非合作平衡解. • 定义4:对于对策对 ,若不存在策略对 ,同时有 , 则称为对策的Pareto最优

二人零和有限对策 • 策略的表示:(矩阵)

二人零和有限对策 • 保守解策略是如下的策略 , • 一般的

二人零和有限对策 • 我们希望 • 定义:在二人零和有限对策中,若甲的支付函数为 ,设有值则称对策有鞍点,公共值称为对策的值,相应的策略对为对策的鞍点.

二人零和有限对策 • 有些时候鞍点是不存在的.例:

混合策略 • 引入混合策略 • 记 • 考虑期望收益

定义:对于 , 若有策略对 满足 , 其中 ,则称为的鞍点.

混合对策的存在性定理 • 定理:设都是紧的,且上连续,对于 ,有 (方法1:用凸集分离定理方法2:用Kakutani不动点原理方法3: )

优策略 • 定义:对于值为而支付函数为的对策,凡使的策略称为甲的优策略.而使的策略称为乙的优策略.

优策略的性质 • 性质1:每个局中人的优策略集是一个凸集. • 性质2:若是乙的优策略,并设则对甲的任何优策略 ,必有: 其中表示甲取策略 ,乙取策略时的支付.

优策略的性质 • 性质3:设为对策值, 为甲的任何优策略,有若对某个 ,有则对乙的任何优策略必有 • 性质4:设为对策值,若对乙的任何优策略有则甲必有一个优策略 ,使得:

优策略的性质 • 性质5:若矩阵可写作分块矩阵若中的每一列严格超出中列的凸组合,又设中的每一行严格的被中行的某个凸组合超出,则 , , 均可删去而不影响甲乙的优策略集.

优策略的计算 • 定理:设对策值为 , 支付矩阵为的对策其优策略为端点优策略的充要条件是存在的子方阵 ,使得: 式中表示的伴随矩阵.

优策略的计算 • 例: 可取可得:

二人一般和有限对策 • 双矩阵对策: • 定义:在对策中,若有策略对 ,使得: 则称为的一个非合作平衡点

存在性定理 • 定理:对每个双矩阵对策至少存在一个非合作平衡点. 对作改进:

判断平衡点 为平衡点

平衡点的Lemke_Howson算法 • 定理:当对策为非退化时,对策肯定存在平衡点. (矩阵A非退化是指: 每个方子阵都是非奇异的(除去最后的零矩阵))

平衡点的Lemke_Howson算法 • 例: 选取

谈判问题 • 可行集 • 谈判的基点(各自的保守收益) • 谈判的结果找 ,使得双方都满意即存在映射 ,使得 .

Nash的谈判公理体系 • 公理1(个体合理性): • 公理2(可行性): • 公理3(Pareto最优性)若且则 . • 公理4(无关方案的独立性):若 , 且 ,则 .

Nash的谈判公理体系 • 公理5(线性变换的无关性)设T是由S经如下线性变换而得到的,如果则必有其中为正常数, 为常数. • 公理6(对称性) :若S是对称的,即若有 ,且若 ,则有 .

谈判定理 • 定理:对于所有的谈判问题 ,存在唯一的满足以上公理的 .

“恐吓”问题 • 考虑以下的双矩阵对策: • 都有独立的恐吓策略,谈判的基点:

二人零和无限对策 • 问题的描述: • 定义:在二人零和无限对策中,若存在使得对所有都成立 ,则称 ( ) 为鞍点. 在无限对策中,鞍点不一定存在.

鞍点 • 定义:在对策 ,点称为鞍点,若下式对任意的都成立,

无限对策中的混合扩张 • 定义: :集合X的子集的代数 y:集合Y的子集的代数 : ,y上所有的概率测度组成的集合称为对策的混合扩张, 其中

混合扩张的平衡点 • 定义: 为二人零和无限对对策, 为对策的混合扩张,若存在使得对所有的都有: 称为对策的混合扩张的平衡点.

具连续支付函数的对策 • 定理:二人零和无限对策中,X,Y为紧集,H为一连续函数,则存在混合策略对使得对任意的都成立.此时有

凸策略与凹策略 • 定义:设X,Y为紧集,并且Y为凸集,支付函数是连续的,且对任意固定的 ,H(x,y)关于y是凸的,则对策称为凸对策. • 当X为凸集,支付函数H是连续的,且对任意固定的 ,H(x,y)关于x是凹的,则称对策为凹对策

凸策略与凹策略 • 定理:设对策为凸对策,则对局中人来说都存在一个最优存策略,且策略的值为 .

Thank You

对策论 ( 一 )

对策论 ( 一 )

Presentation Transcript

2003:An Unprecedented Fire Season

© Ed Silvoso 2003

NORMA ISO 15189:2003

International Council on System Engineering – 2003 Symposium Crystal City, VA June 30, 2003

Elevator Training 2003

.NET Fundamentals ASP.NET - Web Forms December 8, 2003

São Paulo - 04 de agosto de 2003. Porto Alegre - 05 de agosto de 2003.

Part IV: SystemC - Tutorial

第二部分服务器配置与管理

办公软件案例教程

Windows Server 2003: An Update

企业标准体系

Art. 1. Programma dei corsi

2002 年高考数学试题简单评析及 2003 年高考复习启示

Mayo de 2003

SNCAED- SIST ASSEMBLEE GENERALE 2003

网络管理与应用

SPS & WSS. Le 27 mai 2003

常用熟语详析

施普林格出版社香港分社 11/2003

ROLLSPELSBAREN @ LinCon 2003

数据库管理软件 Access 2003 的使用

对策论 ( 一 )

对策论 ( 一 )

Presentation Transcript

2003:An Unprecedented Fire Season

© Ed Silvoso 2003

NORMA ISO 15189:2003

International Council on System Engineering – 2003 Symposium Crystal City, VA June 30, 2003

Elevator Training 2003

.NET Fundamentals ASP.NET - Web Forms December 8, 2003

São Paulo - 04 de agosto de 2003. Porto Alegre - 05 de agosto de 2003.

Part IV: SystemC - Tutorial

第二部分 服务器配置与管理

办公软件案例教程

Windows Server 2003: An Update

企业标准体系

Art. 1. Programma dei corsi

2002 年高考数学试题 简单评析及 2003 年高考 复习启示

Mayo de 2003

SNCAED- SIST ASSEMBLEE GENERALE 2003

网络管理与应用

SPS &amp; WSS. Le 27 mai 2003

常用熟语详析

施普林格出版社香港分社 11/2003

ROLLSPELSBAREN @ LinCon 2003

数据库管理软件 Access 2003 的使用

第二部分服务器配置与管理

2002 年高考数学试题简单评析及 2003 年高考复习启示

SPS & WSS. Le 27 mai 2003