530 likes | 654 Vues
统计学. 天津财经大学统计系. 第十四章 统计决策. 第一节 统计决策的基本概念 第二节 完全不确定型决策 第三节 一般风险型决策 第四节 贝叶斯决策. 第一节 统计决策的基本概念. 一、什么是统计决策 二、统计决策的基本步骤 三、收益矩阵表. 一、什么是统计决策. 狭义的统计决策方法是一种研究非对抗型和非确定型决策问题的科学的定量分析方法。. 二、统计决策的基本步骤. 一个完整的统计决策过程,包括以下几个基本步骤: (一)确定决策目标 决策目标应根据所研究问题的具体特点确定。反映决策目标的变量,称为目标变量。
E N D
统计学 天津财经大学统计系
第十四章 统计决策 • 第一节 统计决策的基本概念 • 第二节 完全不确定型决策 • 第三节 一般风险型决策 • 第四节 贝叶斯决策
第一节 统计决策的基本概念 • 一、什么是统计决策 • 二、统计决策的基本步骤 • 三、收益矩阵表
一、什么是统计决策 • 狭义的统计决策方法是一种研究非对抗型和非确定型决策问题的科学的定量分析方法。
二、统计决策的基本步骤 • 一个完整的统计决策过程,包括以下几个基本步骤: (一)确定决策目标 • 决策目标应根据所研究问题的具体特点确定。反映决策目标的变量,称为目标变量。 (二)拟定备选方案 • 目标确定之后,需要分析实现目标的各种可能途径。这就是所谓拟定备选方案。 (三)列出自然状态 • 所谓自然状态(简称状态),是指实施行动方案时,可能面临的客观条件和外部环境。某种状态是否出现,事先一般是无法确定的。各种状态不会同时出现,也就是说,它们之间是互相排斥的。
(四)测算结果 • 不同方案在各种状态下可能实现的目标变量值,即不同方案在各种状态下的结果,所有的结果构成结果空间。 (五)选择“最佳”或“满意”的方案 (六)实施方案 • 所选择的方案是否真正合适,还需要通过实践的检验。同时,还应将实施过程中的信息及时反馈给决策者。如果实施结果出乎意料,或者自然状态发生重大变化,应暂停实施,并及时修正方案,重新决策。
三、收益矩阵表 • 收益矩阵表是求解统计决策问题的重要工具。其基本形式如表11-1所示。 • 收益矩阵表由以下几部分组成: (一)行动空间;(二)状态空间;(三)状态空间的概率分布(四)收益矩阵 • 收益矩阵的元素qij反映在状态θj下,采用行动方案ai得到的收益值(结果)。这里所说的收益是广义的,凡是能作为决策目标的指标都可以称为收益。收益是行动方案和自然状态的函数,可用下式表示: qij = Q (ai, θj) i =1,2,…,m; j=1,2,…n (14.1)
【例14-1】一家酿酒厂就是否推出一种新型啤酒的问题进行决策分析。拟采取的方案有三种:一是进行较大规模的投资,年生产能力为2500万瓶,其每年的固定成本费用为300万元;二是进行较小规模的投资,年生产能力1000万瓶,其每年的固定成本费用为100万元 ;三不推出该种啤酒。假定在未考虑固定费用的前提下,每售出一瓶酒,均可获纯利0.3元。据预测,这种啤酒可能的年销售量为:50万瓶、1000万瓶和2500万瓶,这三种状况发生的概率分别为:0.2、0.3、0.5。 • 试编制该问题的收益矩阵表。
解:首先分别计算不同状态下采用不同方案可能带来的收益。解:首先分别计算不同状态下采用不同方案可能带来的收益。 例如,当需求量大(年销售2500万瓶)时, • 方案一的收益为: 0.32500-300=450万元; • 方案二的收益为: 0.31000-100=200万元; • 方案三的收益为: 0 • 其他状态的收益计算方法相同,过程不一一列出。 在以上计算的基础上,可编制如下收益矩阵表。
第二节 完全不确定型决策 • 一、完全不确定型决策的准则 • 二、各种准则的特点和适用场合
一、完全不确定型决策的准则 (一)最大的最大收益值准则 • 该准则又称乐观准则或“好中求好”准则。其特点是决策者对未来形势比较乐观。在决策时,先选出各种状态下每个方案的最大收益值,然后再从中选择最大者,并以其相对应的方案作为所要选择的方案。该准则的数学表达式为: (14.2) 式中,a* 是所要选择的方案。
(二)最大的最小收益值准则 • 该准则又称悲观准则或“坏中求好”准则。它正好与乐观准则相反,决策者对未来形势比较悲观。在决策时,先选出各种状态下每个方案的最小收益值,然后再从中选择最大者,并以其相对应的方案作为所要选择的方案。该准则的数学表达式为: (14.3)
【例14-2】 假设例14-1中,有关市场状态的概率完全不知道,试根据最大的最大收益值准则和最大的最小收益值准则进行决策。 • 解: (1)例14 - 1中,方案一在各种状态下的最大收益为450万元,方案二在各种状态下的最大收益为200万元,方案三在各种状态下的最大收益为0,根据最大的最大收益值准则,应选择方案一。 (2)例14 - 1中,方案一在各种状态下的最小收益为-285万元,方案二在各种状态下的最小收益为-85万元,方案三在各种状态下的最小收益为0,根据最大的最小收益值准则,应选择方案三。
(三)最小的最大后悔值准则 • 后悔值又称机会损失值,即由于决策失误而造成的其实际收益值与最大可能的收益值的差距。方案ai在状态θj下的后悔值,可按下式计算: (14.4) • 式中,Q (ai,θj)是在第j种状态下,正确决策有可能得到的最大收益,qij是收益矩阵的元素。 • 如果实际选择的方案正好是这种状态下的最优方案(有可能带来最大收益的方案),则后悔值为0;如果实际选择的方案不如最优方案,决策者就会感到后悔。后悔值越大表明所选的方案与最优方案差距越大。显而易见,rij≥0 。 • 最小的最大后悔值准则的数学表达式为: (14.5)
【例14-3】 假设例14-1中,有关市场状态的概率完全不知道,试求出后悔矩阵并根据最小的最大后悔值准则进行决策。 • 解: (1)在市场需求大的情况下,采用方案一可获得最大收益,故有: 在市场需求中的情况下,采用方案二可获得最大收益,故有: 在市场需求小的情况下,采用方案三可获得最大收益,故有: 将其代入(14.4)式,可求得以下后悔矩阵(参见表14-3)。 (2)由表14-3可知:方案一的最大后悔值为285万元,方案二的最大后悔值为250万元,方案三的最大后悔值为450万元。根据最小的最大后悔值准则,应选择方案二。
(四)折衷准则 • 该准则认为,对未来的形势既不应该盲目乐观,也不应过分悲观。主张根据经验和判断确定一个乐观系数δ(0≤δ≤1),以δ和1-δ分别作为最大收益值和最小收益值的权数,计算各方案的期望收益值E(Q(ai)) (14.6) • 以期望收益值最大的方案作为所要选择的方案。该准则的数学表达式为: (14.7)
【例13-4】 假设例14-1中,有关市场状态的概率不知,根据经验判断的乐观系数为0.6,试根据折衷准则进行决策。 • 解: 将有关数据代入(11.6)式,可得: E(Q(a1)) = 0.6×450 +(1-0.6)(-285)= 156 E(Q(a2)) = 0.6×200 +(1-0.6)(-85)= 86 E(Q(a3)) = 0.6×0 +(1-0.6)×0 = 0 因为在可选择的方案中,方案一的期望收益值较大,所以根据折衷原则,应选择方案一。
(五)等可能性准则 • 该准则认为:既然我们不知道未来各种状态出现的可能性有多大,那么不妨假定其发生的概率相等。在此基础上求各方案收益的期望值,并以期望收益值最大的方案作为所要选择的方案。该准则的数学表达式为: a* =Max E(Q(ai)) (14.8) (i =1,2,---,m) (14.9)
【例14-5】 假设例14-1中,有关市场状态的概率不知,试根据等可能性准则进行决策。 • 解: 将有关数据代入(14.9)式,可得: E(Q(a1)) =1/3(450 + 0 - 285)=55 E(Q(a2)) =1/3( 200 + 200 – 85)= 105 E(Q(a3)) =1/3( 0 + 0 + 0)= 0 因为,按(13.9)式计算的方案二的期望收益值最大,所以按等可能性准则,应选择方案二。
二、各种准则的特点和适用场合 • 由于完全不确定型决策问题相当复杂,而决策者掌握的信息又非常有限,因此,在实际决策时,决策准则的选择往往取决于决策者的偏好,也就是说对准则的选择仍带有相当程度的主观随意性。在选用准则时,应注意分析各种准则隐含的假定和决策时的各种客观条件。客观条件越接近于某一准则的隐含假定,则选用该准则进行的决策结果就越正确。 • 最大的最大收益值准则只有在客观情况确实很乐观,或者即使决策失误,也完全可以承受损失的场合才采用。 • 最大的最小收益值准适用于对未来的状态非常没有把握,或者难以承受决策失误损失的场合。
最小的最大后悔值准则适用于不愿放过较大的获利机会,同时又对可能出现的损失有一定承受力的场合。最小的最大后悔值准则适用于不愿放过较大的获利机会,同时又对可能出现的损失有一定承受力的场合。 • 折衷准则事实上是假定未来可能发生的状态只有两种:即最理想状态和最不理想状态。前者发生的概率是,后者发生的概率是(1-δ)。当δ =1时,该准则等价于乐观准则,而当δ =0时,该准则等价于悲观准则。实际应用该准则时,应根据风险的大小、对未来状态的预计以及对决策失误的承受力,调整δ的赋值。 • 等可能性准则事实上是假定各种状态出现的概率相等。该准则只适用于对未来各种状态发生的可能性完全心中无数的场合。
第三节 一般风险型决策 • 一、自然状态概率分布的估计 • 二、风险型决策的准则 • 三、利用决策树进行风险型决策
一、自然状态概率分布的估计 • 一般风险型决策中,所利用的概率包括客观概率与主观概率。 • 客观概率是一般意义上的概率可来源于频率估计,通常是由自然状态的历史资料推算或按照随机实验的结果计算出来的。例如,购买体育彩票的中奖概率就属于客观概率。 • 主观概率是基于自身的学识、经验做出的对某一事件发生的可能性的主观判断。
二、风险型决策的准则 (一)期望值准则 • 以各方案收益的期望值的大小为依据,来选择合适的方案。 (i =1,2,---,m) (14.10) (二)变异系数准则 • 当出现两个方案收益的期望值相差不大的情况时,可以进一步用变异系数作为选择方案的标准,以变异系数较低的方案作为所要选择的方案。 • 方差Var(ai)和变异系数V的计算公式如下: (i =1,2,…,m) (14.11) (i =1,2,…,m) (14.12)
【例14-6】试利用例14-1中给出的收益矩阵表的资料,根据期望值准则和变异系数准则选择最佳的投资方案。【例14-6】试利用例14-1中给出的收益矩阵表的资料,根据期望值准则和变异系数准则选择最佳的投资方案。 • 解:(1)将有关数据代入(14.10)式,可得: E(Q(a1)) = 450×0.5 + 0×0.3 - 285×0.2 = 168 E(Q(a2)) = 200×0.5 + 200×0.3 - 85×0.2 = 143 E(Q(a3)) = 0 ×0.5 + 0×0.3 + 0×0.2 = 0 (2)E(Q(a3))=0,可以从备选方案中排除。方案一和方案二的期望值虽有差别,但差别不是很大,所以再计算变异系数,帮助判断。将有关数据代入(14.11)式和(14.12)式,可得: Var(a1) = (450-168)2×0.5+(0-168)2×0.3+(-285-168) 2×0.2=89271 Var(a2) = (200-143)2×0.5+(200-143)2×0.3+(-85-143) 2×0.2=12996 所以,如果单纯根据收益期望值大小为标准,应选择方案一;如果将收益的期望值和方差结合在一起考虑,选择方案二比较合适。
(三)最大可能准则 • 该准则主张以最可能状态作为选择方案时考虑的前提条件。所谓最可能状态,是指在状态空间中具有最大概率的那一状态。按照最大可能准则,在最可能状态下,可实现最大收益值的方案为最佳方案。 • 最大可能准则是将风险条件下的决策问题,简化为确定条件下的决策问题。只有当最可能状态的发生概率明显大于其他状态时,应用该准则才能取得较好的效果。
【例14-7】 试利用例14-1中给出的收益矩阵表的资料,根据最大可能准则选择最佳的投资方案。 • 解: 该例的各种自然状态中,“市场需求大”的概率最大,因此,该状态为最可能状态。在市场需求大的状态下,方案一可以获得最大的收益。所以,根据最大可能准则,应选择方案一。
(四)满意准则 • 利用这一准则进行决策,首先要给出一个满意水平。然后,将各种方案在不同状态下的收益值与目标值相比较,并以收益值不低于目标值的累积概率为最大的方案作为所要选择的方案a*。该准则的数学表达式如下: a* = MaxP{ Q (ai,θj)≥A } (14.13) (i =1,2,…,m; j=1,2,….n) 式中,A是给定的满意水平, Q (ai,θj)是i方案在j状态下的收益, P{ Q (ai,θj)≥A }是各方案收益值不低于目标值状态的累积概率。 • 利用该准则的决策结果,与满意水平的高低有很大关系。满意水平一旦改变,所选择的方案也将随之改变。
【例14-8】 试利用例14-1中给出的收益矩阵表的资料,根据满意准则选择满意的投资方案,假定给出的满意水平有200万元和400万元两种。 • 解:(1) P{ Q (a1,θj)≥200 }= 0.5 P{ Q (a2,θj)≥200 }= 0.5+0.3 = 0.8 P{ Q (a3,θj)≥200 }= 0 在备选方案中,方案二达到满意水平的累积概率最大,所以选择方案二。 P{ Q (a1,θj)≥400 }= 0.5 P{ Q (a2,θj)≥400 }= 0 P{ Q (a3,θj)≥400 }= 0 在备选方案中,方案一达到满意水平的累积概率最大,所以选择方案一。
三、利用决策树进行风险型决策 • 决策树是求解风险型决策问题的重要工具,它是一种将决策问题模型化的树形图。决策树由决策点、方案枝、机会点、概率枝和结果点组成。 • 利用决策树对方案进行比较和选择,一般采用逆向分析法,即先计算出树形结构的末端的条件结果,然后由此开始,从后向前逐步分析。 • 与本章第一节介绍过的收益矩阵表相比,决策树的适应面更广,它并不要求所有的方案具有相同的状态空间和概率分布。 • 它特别适用于求解复杂的多阶段决策问题。
解:(1)根据题中给出的条件,画出决策树结构图(参见图14-2)。解:(1)根据题中给出的条件,画出决策树结构图(参见图14-2)。
(2)计算决策树最末端的条件收益值。这里采用的计算式如下:(2)计算决策树最末端的条件收益值。这里采用的计算式如下: 净收益=可能销售量×单价-生产量×单位成本-应摊新投资费用 当生产批量大于市场需求量时,可能销售量等于市场需求量。而当生产批量小于市场需求量时,可能销售量等于生产批量。另外,当选择方案一组织生产时,应摊新投资费用等于0,选择方案二组织生产应摊新投资费用100万元。例如:右边第一个结果点的条件收益=2000-3000×0.6-0=200 (3)利用各条件收益值和相应的概率分布,计算最右端各机会点的期望收益值。例如:机会点⑥的期望值=200×0.45+1200×0.55=750
(4)根据期望值准则,选出决策点3 、4 、5的最佳生产批量,并将最佳方案的期望收益值填在相应的决策点的上方。同时,剪除落选的方案枝。例如:在决策点3选择生产2000件的方案,该方案的期望收益值为800万元。 (5)利用决策点4 、5的结果,计算机会点②的期望收益值。将其与方案一的期望收益值比较,按照期望值准则选择最佳方案。 • 从图中可以看出,方案二的期望收益值为875万元,大于方案二的期望收益值(800万元)。 • 本例决策树分析的结论是:该汽车配件厂应按方案二对设备进行更新改造,如果能够成功,就采用新生产方法组织生产,其批量安排为3000;如果失败,则仍采用原生产方法组织生产,其批量安排为2000。
第四节 贝叶斯决策 • 一、什么是贝叶斯决策 • 二、贝叶斯公式与后验概率的估计 • 三、先验分析与后验分析 • 四、后验预分析
一、什么是贝叶斯决策 • 利用补充信息修订的概率称为后验概率。所谓贝叶斯决策,就是利用补充信息,根据概率计算中的贝叶斯公式来估计后验概率,并在此基础上对备选方案进行评价和选择的一种决策方法。
二、贝叶斯公式与后验概率的估计 • 设某种状态θj的先验概率为P(θj),通过调查获得的补充信息为ek ,θj给定时,ek的条件概率(似然度)为,则在给定信息ek的条件下, 可用以下贝叶斯公式计算θj的条件概率即后验概率: (14.14) • 上式的分母是ek出现的概率P(ek)。
【例14-10】某空调机生产厂家拟向另一电子元件厂购买某种电子元器件,根据过去的经验,该电子元件厂产品发生不同次品率的概率分布如表14-5第二栏所示。但据说,该厂的产品质量最近有所提高。现从市场上该电子元件厂出售的该种元器件中,随机抽取了10件,结果未发现次品。试计算出现这种结果的概率,并根据这一信息,对以往元器件厂次品率的概率分布进行修正。 • 解:以往的概率分布可视为先验概率。在本例中,各种不同次品率给定条件下,抽查10件发生0件次品(发生0件为)的概率近似地服从于二项分布,其似然度可按以下方式计算: (j=1,2,3,4) (14.15) 例如,
将先验概率与似然度代入(14.14)式,可求得不同状态下的后验概率,结果如表13-5中最后一栏(第5栏)所示。例如,次品率为0.05状态的后验概率为:将先验概率与似然度代入(14.14)式,可求得不同状态下的后验概率,结果如表13-5中最后一栏(第5栏)所示。例如,次品率为0.05状态的后验概率为: • 而随机抽取10件不出现次品的概率为: • 从表中结果可以看出:由于实际抽查的次品率为0,因此,次品率为0.05这种状态的后验概率大于先验概率,而次品率为0.15和 0.20这两种状态的后验概率小于先验概率。
三、先验分析与后验分析 • 先验分析是利用先验概率进行决策,而后验分析则是利用后验概率作为选择与判断合适方案的依据。一般来说,只要补充信息是准确的,则后验分析的结论更为可靠。
【例14-11】设在例14-10中,对于是否向电子原件厂购买电子元器件,空调机厂有两种可供选择的方案即:方案一购买;方案二不购买。假设其收益矩阵表如14-6所示。试根据期望值准则,进行先验分析和后验分析。 【例14-11】设在例14-10中,对于是否向电子原件厂购买电子元器件,空调机厂有两种可供选择的方案即:方案一购买;方案二不购买。假设其收益矩阵表如14-6所示。试根据期望值准则,进行先验分析和后验分析。
解:(1)先验分析 E(Q(a1))=200×0.1+50×0.4-100×0.4-300×0.1=-30 E(Q(a2))=0 根据先验概率和期望值准则,应选择方案二。 (2)后验分析 E(Q(a1))=200×0.207 +50×0.483-100×0.273-300×0.037=27.15 E(Q(a2))=0 根据后验概率和期望值准则,应选择方案一。
四、后验预分析 • 在正式进行补充信息的调查之前,还需要将先验分析最佳方案的期望收益与各种可能的后验分析最佳方案的期望收益加以比较,了解收集补充信息所需的费用和可能带来的收益,对是否值得进一步收集补充信息的问题做出判断,并选择最佳的收集补充信息的方案。这一环节被称为后验预分析。
解:(1)先验分析 根据题意可列出该问题的收益矩阵表: E(Q(a1))=1000×0.6-500×0.4=400万元; E(Q(a2))=0 根据期望值准则,应选择方案一即在9 月份施工。
(2)后验概率估计 • 设气象站发出的预报为,其结果无非是以下两种:天气好,天气坏。则预报的准确率就是似然度。按照前面介绍过的估计后验概率的方法,可分别列出两种预报结果的后验概率计算表。