540 likes | 646 Vues
第五章 数字特征 和特征函数. 我们已经知道,分布函数(或概率分布、密度函数)全面地描述了随机变量的统计规律。 但是无论从理论或者应用的角度来看,从某些侧面粗线条地描述随机变量的统计规律仍是十分必要的。 首先,全面地反映与描述没有突出重点; 其次,在实际应用中要全部掌握一个随机变量的分布也是困难的。事实上,只要能了解几个充分反映出分布特点的数值指标就够用了。这些数值指标就是随机变量的数字特征,它们是本章要讨论的主要内容。
E N D
第五章 数字特征和特征函数 我们已经知道,分布函数(或概率分布、密度函数)全面地描述了随机变量的统计规律。 但是无论从理论或者应用的角度来看,从某些侧面粗线条地描述随机变量的统计规律仍是十分必要的。 首先,全面地反映与描述没有突出重点; 其次,在实际应用中要全部掌握一个随机变量的分布也是困难的。事实上,只要能了解几个充分反映出分布特点的数值指标就够用了。这些数值指标就是随机变量的数字特征,它们是本章要讨论的主要内容。 随机变量有许多数字特征,我们主要介绍数学期望、方差和相关系数,它们分别表示随机变量一切可能值的集中位置、集中和分散的程度以及随机变量之间相依的程度。 另外,本章第四节的特征函数,不作介绍。
第一节 数学期望 一、 数学期望的定义 先看一个例子,引出离散型随机变量数学期望值的定义。 假设有三个射手,他们射击命中目标的环数分别为离散型 随机变量 X,Y,Z,它们的概率分布分别为: 试比较谁的射击技术更好? 由上述讨论的启发,我们引出离散型随机变量数学期望的定义。 即平均值的定义。不但要考虑其取的值,还要考虑其概率。
定义 5-1 设 X 是离散型随机变量,其概率分布为 若级数 绝对收敛,则称该级数的和为随机变量 X 的数学期望(mathematical expectation) (或均值(mean value)),记作 ,即 若级数 不是绝对收敛,即 则称随机变量 X 的数学期望不存在。 随机变量 X 的数学期望反映了 X 取值的平均值,它由 分布完全决定。当分布给定时,数学期望为一数值(常数)。 我们假定级数绝对收敛,因而保证了级数的和与求和的 次序无关。
X 0 1 例 5-1 若随机变量 X 服从 0-1 分布,试求它的数学 期望 EX。 解 0-1 分布的分布律为: 故有: 服从 0-1 分布的随机变量 X 的数学期望为 : p 。
X 0 1 2 ……k …… 例 5-2 若随机变量 X 服从参数为λ的普阿松分布,即 X~P(λ),试求它的数学期望 EX。 解 因为参数为λ的普阿松分布为: 于是:
X 1 2 3 ……k …… 例 5-3 若随机变量 X 服从参数为 p 的几何分布,即 X~G(p),求 X 的数学期望 EX。 解 X 服从参数为 p 的几何分布:分布律为: 故有: 由于 两边求导: 上式令 x=1-p 即 所以:
分值 100 95 90 85 80 75 70 65 60 55 50 奖(元) 50 30 20 10 -3 -5 -3 10 20 30 50 例 5-4 有一游戏,在一袋中有形状大小完全一样的20个 球,其中红、白球各10个,记红球为10分,白球为5分。游戏 的规则为:某人从袋中随机地抽取10个球,并且将 10个球的 分值相加,根据相加的分值由以下的表进行奖罚: 其中三项负的表示应罚的金额。 请问:你认为这样的游戏方式对他有利吗?试分析说明。 设 X 表示抽取10个球中红球的个数,显然 X 服从超几何分布,即 则有 经计算得
分值 100 95 90 85 80 75 70 65 60 55 50 奖(元) 50 30 20 10 -3 -5 -3 10 20 30 50 X 0 1 2 3 4 5 6 7 8 9 10 设 X 表示抽取10个球中红球的个数,显然 X 服从超几何分布,即 则有
分值 100 95 90 85 80 75 70 65 60 55 50 奖(元) 50 30 20 10 -3 -5 -3 10 20 30 50 X 0 1 2 3 4 5 6 7 8 9 10 Y -5 -3 10 20 30 50 P 34.37% 47.74% 15.59% 2.191% 0.108% 0.001% 设 X 表示抽取10个球中红球的个数,显然 X 服从超几何分布,即 相应的分值分布为: 则有红球的个数 X 的分布: 奖金 分值 再设 Y 表示每次游戏所奖的金额数(单位为元), 所以 Y 的概率分布为: 则由数学期望的定义可得
假设 X 是一个连续型随机变量,其密度函数 取分点 ,记 则 X 落在区间 中的概率为 当Δxi充分小时,就有 此时,X’的概率分布为 离散型随机变量X′可以看做是X的一种近似,而这个离散型随 机量X′的数学期望为: 这种近似也就愈好,故 当分点愈密时,即
定义 5-2 设 X 为连续型随机变量,其密度函数为 若积分 绝对收敛,即 则称 为随机变量 X 的数学期望 (mathematical expectation)。记作: 即 若积分 不是绝对收敛,即 则称随机变量 X 的数学期望不存在。 与离散型随机变量一样,连续型随机变量 X 的数学期 望反映了 X 取值的平均值,它由分布完全决定。当分布给 定时,数学期望为一数值(常数)。
例5-5设 X 服从均匀分布,即X~U[a,b],试求 X 的数学期望。 解 均匀分布 X~U[a,b]的密度函数为: 故有: 均匀分布的数学期望,正好是区间[a, b]的中点。
例 5-6 设 X 服从参数为λ的指数分布,即X~Exp(λ), 试求 X 的数学期望 EX。 解 X 的密度函数为: 故有:
例 5-7 设 X 服从正态分布,即 试求 X 的数学期望 EX。 解 令
二、 随机变量函数的数学期望 对于随机变量 X 的函数 也是随机变量,则 也可利用定义来求数学期望。 但是,这样做往往比较烦琐。我们可以应用下列的定理, 直接利用 X 的概率分布或密度函数去求出 从而避免了求解 Y=f(X)的分布的过程。 定理 5-1 设 Y=f(X)为随机变量 X 的函数,且f(X) 的数学期望存在: (1)若 X 为离散型随机变量,其概率分布为 则 (2)设 X 为连续型随机变量,其密度函数为 p(x), 若 Y = f(X)也是连续型随机变量,则
定理 5-1 设 Y=f(X)为随机变量 X 的函数,且f(X) 的数学期望存在: (1)若 X 为离散型随机变量,其概率分布为 则 (2)设 X 为连续型随机变量,其密度函数为p(x), 若 Y = f(X)也是连续型随机变量,则 证明(1)因为X 和 Y 的分布律为: 显然有: 证明(2) 略。
对于随机向量(X, Y)的函数 Z=f(X,Y),我们有以 下类似的结论。 定理 5-2 设 Z=f(X,Y)为随机向量(X,Y)的函数, 且 存在: (1)若(X,Y)为离散型随机向量,其联合概率分布为 则 (2)若(X,Y)为连续型随机向量,其联合密度函数为 则 定理 5-1和 定理 5-2 在理论上和实用上都有重大意义, 这里我们举一些例子说明其应用。 证明 略。
例5-8 设随机变量 X 服从参数为 λ 的普阿松分布,即 的数学期望 : 试求 解 由定理 5-1(1)可知,
例 5-9 设随机变量 X 服从参数为 p 的几何分布,即 的数学期望 : 试求 解 X 的概率分布为: 由定理 5-1(1)可知, 再由例 5-3 可知, 即 两边对 p 求导,得 即 从而
例 5-10 设 X 服从均匀分布,即 的数学期望 : 试求 解 由定理 5-1(2)可知,
例 5-11 设 X 服从参数为λ的指数分布,即 的数学期望 : 试求 解 由定理 5-1(2)可知,
例 5-13 设随机变量 X,Y 相互独立,且均服从 分布,试求 解 因为 且 X, Y 独立, 则(X, Y)的联合密度函数为: 则
例 5-14 设某种商品每周的需求量X是服从区间[10,30]上均匀分布的随机变量, 而经销商店的进货数量为[10,30]中的某一整数,商店每销售一单位商品可获利500元;若供大于求则削价处理,每处理一单位商品亏损100元;若供不应求,则可从外部调剂供应,此时每一单位商品仅获利300元。为使商店所获利润期望值不少于9280元,试确定最少进货量。 解 设进货量为 a,10 ≤ a ≤ 30,且用 Y 表示利润,则 显然 Y 为 X 的函数,记Y=f(X),从而期望利润为
例 5-14 设某种商品每周的需求量X是服从区间[10,30]上均匀分布的随机变量, 而经销商店的进货数量为[10,30]中的某一整数,商店每销售一单位商品可获利500元;若供大于求则削价处理,每处理一单位商品亏损100元;若供不应求,则可从外部调剂供应,此时每一单位商品仅获利300元。为使商店所获利润期望值不少于9280元,试确定最少进货量。 解 设进货量为 a,10 ≤ a ≤ 30,且用 Y 表示利润,则 为使商店所获利润期望值不少于9280元,有: 即: 解不等式得: 最少进货量为 21 单位。
三、 数学期望的性质 随机变量的数学期望具有下述基本性质,其中假设性质 中的数学期望均存在。 性质 5-1 设 c 为常数,则 证明 第一式中的常数 c 可看做特殊的随机变量,即 X ≡ c, 则其概率分布为P(X=c)=1,从而 第二式仅证离散型情形 第三式仅证连续型情形 性质5-1可概括为: ,其中a,b,c为常数。
性质 5-2 证明 (仅证离散型情形 ) 性质 5-2 可推广为: 由归纳法易证。更一般地, 其中, ci, i=1, …, n 为常数。
性质 5-3 若 X 与 Y 相互独立,则 证明 (仅证连续型情形 ) 性质 5-3 可推广为:若 X1,X2,…,Xn相互独立,则 由归纳法易证。略 性质 5-1,2,3 及其推广提供了求数学期望的方法。
定理 5-3 (柯西—施互茨(CauchySchwarz)不等式) 证明 对任意的实数 t, 考虑 由于对于任意的实数 t 恒有 即 故判别式Δ≤ 0, 即 从而
第i个车站有旅客下车 第i个车站没有旅客下车 例 5-15 一民航机场的送客汽车载有20位旅客,自机场开出,沿途有10个车站。如到达一个车站没有旅客下车,就不停车。以 X 表示停车次数,求 EX(假设每个旅客在各个车站下车是等可能的,且各旅客是否下车相互独立)。 解 设 则 因此,为求 EX,只需求 即可。 由于任一旅客在第i个车站不下车的概率为 9/10,又旅客是 否下车是彼此独立的,因此,20个旅客在第i个车站都不下车 的概率为 ,在第i个车站有人下车的概率为 即Xi的概率分布为:
第i个车站有旅客下车 第i个车站没有旅客下车 例 5-15 一民航机场的送客汽车载有20位旅客,自机场开出,沿途有10个车站。如到达一个车站没有旅客下车,就不停车。以 X 表示停车次数,求 EX(假设每个旅客在各个车站下车是等可能的,且各旅客是否下车相互独立)。 解 设 则 因此,为求 EX,只需求 即可。 即Xi的概率分布为: 从而 ,故由性质的推广知, 即送客汽车平均停车 8.784。
第i次试验A发生 第i次试验A不发生 例 5-16 设 X 服从二项分布,即 试求 EX。 解 由第三章二项分布可知,X 可看做 n 次独立重复试 验中事件 A 发生的次数,且P(A)=p,令 则 相互独立且都服从参数为 p的 0-1 分布。 易知有 故由性质 5-2 的推广知,
四、 矩 (略) 如果需要进一步研究数字特征,则需讨论随机变量的矩, 它在概率论与数理统计中占有重要地位。最常用的矩有两种: 一种是原点矩,一种是中心矩。 定义5-3 如果 为任意正整数,则称 为随机变量 X 的 k阶原点矩(origin moment), 而称 为随机变量 X 的 k 阶中心矩 (central moment)。 显然,数学期望是一阶原点矩 m1。运用初等不等式 可知,若随机变量 X 的高阶矩有限,则其低阶矩也有限。
第五章 习题 (P133) 1*,4* (离散) 2*,3, (连续) 5,6*,7,8*,9,10, 11*(函数) 12*,13*,14,15,16
X -1 0 1 Y -20 0 20 第二节 方差 一、 方差的定义 数学期望描述了随机变量取值的平均值,即其是分布的 位置特征数,它位于分布的中心,随机变量的取值在其周围 波动。 方差是度量此种波动大小的最重要的特征数,下面分析 一个简单的例子,引出它的定义。 有下列两个随机变量的分布: 显然有: 但其取值的分散程度大不同。 可见,数学期望还不能反映随机变量取值的分散程度。
X -1 0 1 Y -20 0 20 有下列两个随机变量的分布: 显然有: 但其取值的分散程度大不同。 可见,数学期望还不能反映随机变量取值的分散程度。 设有一随机变量 X,称 X-EX 为偏差, 此种偏差可大可小,可正可负, 为了使此种偏差能积累起来,不至于正负抵消,可取绝 对偏差的均值 |X-EX| 来表示随机变量取值的波动大小。 由于绝对值在数学上处理不甚方便,故用 衡量偏差更合适。它也是随机变量,取其平均值 就可以作为刻画随机变量 X 取值的波动大小(或取值分散 程度)的一个数字特征。即方差 。
定义 5-4 设 X 是一个随机变量,若 存在, 则称 为X的方差(variance),记为 DX 或 VarX, 即 方差的平方根,称为标准差或根方差(standard deviation)。 即 若 X 为离散型随机变量,其概率分布为 则按方差的定义有: 若 X 为连续型随机变量,其密度函数为p(x),则按方差 的定义有:
若 X 为离散型随机变量,按方差的定义有: 若 X 为连续型随机变量,其密度函数为p(x),则按方差 的定义有: 数学期望和方差是随机变量的最基本、最常用的两个数字特 征。 数学期望刻画了随机变量取值的平均位置,因而也有人称它 是位置特征; 方差刻画了随机变量偏离其数学期望的(分散)程度,方差 越小,随机变量取值越集中于数学期望的周围。称离散特征。 为计算方便,方差的公式也可简化为:
X 0 1 例5-17 若随机变量 X 服从 0-1 分布,试求 X 的方差。 解 由例 5—1 知: ,又 则 其中 又解: 则:
例5-18 若随机变量 X 服从参数为λ的普阿松分布 , 试求 X 的方差。 解 由例 5—2 知: ,又 则
例5-19 设随机变量 X 服从参数为 p 的几何分布,即 ,试求 X 的方差。 解 X 的概率分布为 由例 5—3,5-9 知 ,及 则 其中
例5-20 设随机变量 X 服从均匀分布,即 试求 X 的方差。 解 X 的概率分布为 由例 5—5,5-10 知 ,及 则
例5-21 设随机变量 X 服从参数为λ的指数分布,即 ,试求 X 的方差。 解 X 的概率分布为 由例 5—6,5-11 知 ,及 则
正态分布的参数 μ 是它的数学期望,参数 是它的方差。 例5-22 设随机变量 X 服从正态分布,即 试求 X 的方差。 解 X 的概率分布为 由方差的定义知,
二、 方差的性质及切比雪夫不等式 随机变量的方差具有下述基本性质,其中假设性质中的方 差均存在。 性质 5-4 设 c 为常数,则 证明
性质 5—5 若 X,Y 是两个相互独立的随机变量,则 证明 其中当 X 与 Y 独立时,有: 还可以将此性质推广到多个随机变量的情况,即设 相互独立的随机变量,则:
例5-23 设随机变量 X 服从二项分布,即 试求方差 DX 。 解 X 的概率分布为 由例5--16可知, 其中 相互独立,且 都 服 从 参数为 p 的 0-1 分布,故由性质 5-5 的推广可知, 其中
性质 5—6 随机变量 X 的方差 DX=0 的充分必要条件是: X 取某个常数的概率为 1,即对某个常数 a,有 充分性为性质 5—4 的(1),必要性超出本书范围,证明从略。 定义 5-5 对任一随机变量 X,若 DX>0,则称 为 X 的 标准化(standardized)随机变量。 性质 5-7 若 Y 为 X 的标准化随机变量,则 证明
下面我们来介绍一个重要的不等式——切比雪夫 (Chebyshev)不等式。 定理 5-4(切比雪夫不等式)对任一随机变量 X,若 DX存 在,则对任一正数 , 恒有: 先分析以上不等式的含义。见图:如有 即为: 令 则上式为: 而根据 原理,有:
切比雪夫不等式只要知道随机变量的数学期望和方差,没 有用到随机变量的分布,这是切比雪夫不等式的优点,所以它 有很广泛的应用,是概率论中一个重要的基本不等式。然而也 正是由于这个原因,一般来说它给出的估计是比较粗糙的。 如前例,对于任一随机变量 X,若 则由切比雪夫不等式可得下述估计: 若 则由第三章正态分布可知, 即 比较前者(分布未知)和后者(分布已知)的结果,就可 知道前者的估计确实要粗糙得多。