1 / 29

第五章 数据分布特征的描述

第五章 数据分布特征的描述. 本章主要内容 : 1. 集中趋势的描述 2. 数值平均数 3. 位置平均数 4. 离中趋势的描述 本章讲授方法 : 讲练结合 本章讲授课时 : 6 课时. 一、集中趋势与平均指标 (一)集中趋势的含义:是指某一组数据向某一中心值靠拢的倾向,这种倾向就是集中趋势。 (二)平均指标:是用来反映总体的一般水平和集中趋势的指标,也即集中趋势的中心值。 平均指标的具体表现称为平均数。

Télécharger la présentation

第五章 数据分布特征的描述

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第五章 数据分布特征的描述 • 本章主要内容: 1. 集中趋势的描述 2.数值平均数 3.位置平均数 4.离中趋势的描述 • 本章讲授方法: 讲练结合 • 本章讲授课时: 6课时

  2. 一、集中趋势与平均指标 (一)集中趋势的含义:是指某一组数据向某一中心值靠拢的倾向,这种倾向就是集中趋势。 (二)平均指标:是用来反映总体的一般水平和集中趋势的指标,也即集中趋势的中心值。 平均指标的具体表现称为平均数。 现象分布的集中趋势,主要是由平均指标来反映的。平均指标主要包括数值平均数和位置平均数。 第一节 集中趋势指标

  3. (三)平均指标的作用 1.可以对比不同总体的一般水平,即进行不同空间的水平比较。 2.可以对不同时间的现象进行比较,即进行不同时间上的同一现象进行比较。 3.分析现象之间的相互关系,并进行相关推算。 (四)平均指标的特点: 1.平均指标是个代表值 2.把被研究总体各单位的标志值的数量差异抽象化了。

  4. 二、数值平均数 (一)算术平均数: 1.定义:是变量的所有变量值之和除以变量值的个数。 2.计算公式:根据掌握的资料的不同,分为简单算术平均数和加权算术平均数。 (1)简单算术平均数 合计 算术平均数 资料未分组 总体单位的个数 变量值

  5. 例如: 某学习小组的五名学生数学学习成绩分别为:62、85、73、90、77。则其平均成绩为: 五名学生的数学平均成绩为77.4分

  6. (2)加权算术平均数 各组单位数(权数) 加权算术平均数的计算公式 权数:平均数大小,不仅受变量值的影响,还受各组次数的影响,哪一组次数多,变量值就会趋向于这个值,所以各组次数可以起到一个权衡平均数大小的这样一个作用,所以也称之为权数。 加权算术平均数与简单算术平均数的关系:如果各组次数相等,即权数相当时,加权算术平均数就变成了简单算术平均数了。权数的作用没有了。 根据分组资料计算

  7. 某生产小组工人生产零件情况

  8. (3)算术平均数的数学性质 各变量值与其算术平均数的离差之和等于零 各变量值与其算术平均数的离差平方和为最小值. 根据组距数列计算的算术平均数仅是个近似值,是在假定各组数据分布均匀的前提下计算的。

  9. (二)调和平均数 1.定义:调和平均数是各变量值倒数的算术平均数的倒数。 在实际应用中,更多地是做为算术平均数的变形来应用的 2.计算公式: (1)简单调和平均数:各组标志总量相等时,可采用简单。其计算公式: 调和平均数 组数 各组标志总量 各组标志值

  10. 例: 市场上某种蔬菜的价格是早市每公斤1.25元,午市每公斤1.20元,晚市每公斤1.10元,若某饭店早、中、晚各买10元钱的蔬菜,问所购蔬菜的平均价格是多少? 购买蔬菜的金额是标志总量,且三组均为10元 该饭店购买的这种蔬菜价格为1.18元

  11. (2)加权调和平均数 当各组标志总量不相同时。应采用加权调和平均数。其计算公式为: 在这个公式中,各组的标志总量即权数是不相等的,如果相等了,就等于简单调和平均数了。 调和平均数,通常是做为算术平均数的变型来应用的在不同的情况下,有的时候采用算术平均数,有的时候采用调和平均数。 权数

  12. (3)调和平均数的应用 在 计算绝对数的平均数时,通常采用加权算术平均数就可以了,当计算相对数或平均数的平均数时,就需要进行判断,是采用加权算术平均数还是调和平均数。 相对数或平均数都是由两个数值比对形成的,我们可以称之为比值变量。 当知道比值变量及其分子时,我们应该以分子做为权数,采用加权调和平均数的计算公式,如果知道比值变量及其分母时,我们应该以分母做为权数,采用加权算术平均数的计算公式。 加权 调和 加权 算术

  13. 某公司所属三个部门资金利润率及平均占用资金资料如下:某公司所属三个部门资金利润率及平均占用资金资料如下: 在这个例子中,利润率是个相对数,是个比值变量。如果我们知道了利润率和利润率的分母平均资金占用时,我们可以采用以平均资金占用为权数的加权算术平均数计算公式

  14. 如果将上例条件变换如下: 在这个例子中,我们知道了比例变量利润率和分子利润额,所以应该利用以分子利润额为权数的加权调和平均数计算分式:

  15. (三)几何平均数 1.定义:几何平均数是n个变量值乘积后的开n次方根。通常是计算平均比率或平均速度。 2.计算公式: (1)简单几何平均数 (2)加权几何平均数 资料未分组 资料已经分组

  16. 例: 某机械厂五个流水作业车间的合格率分别为96%、94%、95%、95%、96%,则五个车间的产品平均合格率为?

  17. 三、位置平均数 (一)中位数 1.中位数的定义:是变量的所有变量值按大小排列后,处于中间位置上的那个变量值。 2.计算方法: (1)根据未分组资料计算: 首先将所有的变量值按大小进行排序; 其次确定中位数。 中位数me= n 为 变 量 值 的 个 数 n为奇数 n为偶数

  18. (2)根据分组资料确定中位数 各组频数 ①根据单项式数列计算: 步骤:第一,确定中位数位置: 第二,对数列中各组的频数进行向上累计或向下累计 第三,确定中位数:当某一组的累计频数大于或等于 时,该组的变量值就是中位数。 中位数为3.

  19. ② 根据组距数列计算 步骤:第一,确定中位数所在位置; 第二,对数列的各组频数进行向上累计或向下累计; 第三,确定中位数所在组; 第四,根据下面的比例插值法公式确定中位数; 下限公式: 上限公式: 中位数所在组下限 中位数所在组组距 中位数所以组频数 中位数组以下各组累计次数 中位数组以上各组累计次数 中位数所在组上限

  20. 例如,某电子元件厂工人日产量资料如下: • 中位数所在组为:1000-1100件这一组。然后根据下限公式计算中位数为:

  21. (二)众数 1.定义:众数是变量数列中出现次数最多,频率最高的变量值。 2.计算方法: (1)根据单项式数列计算: 出现次数最多的变量值即为众数。 (2)根据组距数列计算: 先确定众数所以组,然后根据下列公式计算。 下限公式 上限公式 △1为众数组次数与下一组次数之差 △2为众数组次数与上一组次数之差

  22. 如上例 • 在这个例子中,可以看到众数组为1000-1100这一组。根据下限公式,我们可计算众数为:

  23. 第二节 离中趋势的描述 一、离中趋势和离散指标 (一)离中趋势:是指一组数据中各数据值以不同程度的距离偏离中心的趋势。 (二)离散指标:就是反映变量值变动范围和差异程度的指标,即反映分布中各变量值远离中心值或代表值程度的指标。(反映变量值不一样的程度) (三)作用: 1.可以用来衡量和比较平均数的代表性;(反比) 2.可以用来反映各种现象活动过程的均衡性; 3.可以反映数据分布的离散程度。 离散指标主要介绍:全距、平均差、标准差、标准差系数。

  24. 二、离散指标的测度 (一)全距(极差) 1.定义:最大变量值与最小变量值之差。 2.计算方法: 在单项式变量数列中,用变量值中的最大值减去最小值即可。而在组距式变量数列中,应用变量值最大组的上限减去变量值最小组的下限。 3.优缺点: 优点:计算简便,应用比较多,如压差、温差等。 缺点:受极值影响大,计算粗糙,没有考虑到所有变量值。

  25. (二)平均差 1.定义:是各变量值与其平均数离差绝对值的算术平均数。 2.计算公式: (1)简单式: (2)加权式: 平均差在计算上,不利于代数运算,所以通常不用这种方法计算,而是采用一种更合理的测定方法:标准差。 资料未分组 资料已经分组

  26. (三)标准差 1.定义:是各变量值与其平均数离差平方的算术平均数的平方根。标准差的平方叫方差。 2.计算公式: (1)简单式: (2)加权式: 总体的标准差通常用 表示,而样本的标准差通常用S表示。 资料未分组 资料已经分组

  27. 例如,某电子元件厂工人日产量资料如下:

  28. (四)标准差系数 1.定义:是指标准差与其平均数相对比得到的比率。 标准差系数是一个相对指标,当比较的现象水平不相等或计量单位不同的情况下,可以用这个指标进行对比。 例如: 10 11 12 13 14 101 102 103 104 105 这两组数值的标准差是一致的,但实质上其离散程度是不一样的。因为其平均水平是不相等的。在这种情况下如果比较其离散程度,应该用相对离散程度来比较。 2.计算公式:

  29. 例如:两个企业工资相关资料如下: 甲企业:平均工资为1200元,标准差为57元; 乙企业:平均工资为2000元,标准差为60元。 试比较两个企业的平均工资的代表性。 从上面的计算结果上看,如果从绝对数(即标准差上比较,甲企业的平均工资的代表性好于乙企业,但如果从标准差系数上来看,甲企业的平均工资的代表性就不如乙企业了。

More Related