1 / 42

统计学原理(第六讲)

统计学原理(第六讲). 罗洪群. 本章教学目的与要求 : 相关分析是研究变量之间相互关系的密切程度和相互联系方式的重要方法。本章详细讲述了相关分析的概念、相关关系的确定、回归方程的建立和应用等内容。通过本章的学习,要理解相关分析的有关概念,掌握计算相关系数和配合回归方程的方法,并能够结合实际资料对变量进行相关分析。. 本 章 主 要 内 容. 第一节 相关的意义和种类. 第二节 相关系数. 第三节 回归分析. 第一节 相关的意义和种类. 一、相关分析的含义: P259. 二、相关关系的概念.

shelly-chen
Télécharger la présentation

统计学原理(第六讲)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 统计学原理(第六讲) 罗洪群

  2. 本章教学目的与要求: 相关分析是研究变量之间相互关系的密切程度和相互联系方式的重要方法。本章详细讲述了相关分析的概念、相关关系的确定、回归方程的建立和应用等内容。通过本章的学习,要理解相关分析的有关概念,掌握计算相关系数和配合回归方程的方法,并能够结合实际资料对变量进行相关分析。

  3. 本 章 主 要 内 容 第一节 相关的意义和种类 第二节 相关系数 第三节 回归分析

  4. 第一节 相关的意义和种类 一、相关分析的含义:P259 二、相关关系的概念 函数关系是一种严格的依存关系,这种关系可以用y = f(x)的方程来表现。 相关关系是一种不完全确定的随机关系。 函数关系与相关关系的联系:对具有相关关系的现 象进行分析时,必须利用相应的函数关系的数学表 达式来表明现象之间的相关方程式。

  5. 第二节 相关图表和相关系数 一、相 关 图 表 相关图表是相关分析的重要方法。通过相关图表可 以直观地判断现象之间呈现的相关的形态和方向。 简单相关表(P264表7-3) 相关表 单变量分组相关表(P265表7-4) 分组相关表 双变量分组相关表(P266表7-5) 利用直角坐标系第一象限,把自变量置于横轴上, 因变量置于纵轴上,在将两变量相对应的变量值 用坐标点形式描绘出来即可。(p268图7-1) 相关图

  6. 二、相 关 系 数 相关系数是测定变量之间相关密切程度的统计指标。 1、相关系数的计算方法: 相关系数按“积差法”计算。该方法是通过两变量与各 自平均值的离差的乘积来反映两变量之间的相关程度。 积差法公式在教材第271页 计算相关系数的简化式:

  7. 2、相关系数的性质 (1)相关系数有正负号,分别表示正相关和负相关。 (2)相关系数的取值范围在绝对值的 之间。 其值大小反映两变量之间相关的密切程度, 具体判断方法见教材P275。 (3)相关系数 表明两变量完全相关; 表明两变量完全不相关;

  8. 号 月产量 生产费用 1 2 3 4 5 6 7 8 1.2 2.0 3.1 3.8 5.0 6.1 7.2 8.0 62 86 80 110 115 132 135 160 ∑ 36.4 880 相关系数计算分析例题 1.44 3844 74.4 4.00 7396 172.0 9.61 6400 248.0 14.44 12100 418.0 13225 575.0 25.00 805.2 17424 17.21 972.0 18225 51.84 1280.0 64.00 25600 207.54 104214 4544.6 统计学原理(第六讲)

  9. 根据计算结果可知: 则相关系数为: 说明产量和生产费用之间存在高度正相关。 统计学原理(第六讲)

  10. 第三节 回 归 分 析 一、回 归 分 析 的 意 义 回归分析是对具有相关关系的两个或两个以上变量之间的数量变化的一般关系进行测定,确立一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估算预测提供一个重要的方法。 二、回 归 的 种 类 一 元 回 归 按自变量的个数分 多 元 回 归 线 性 回 归 按回归线的形态分 非线性回归

  11. 三、简单线性回归方程 简单线性方程式的一般形式: (当两变量的增长比率为常数时,它们之间就呈 现为一种简单线性关系。) 利用简单线性回归方程进行回归分析的前提: 所分析的两个变量之间必须存在相关关系,且 相关程度在显著相关以上。 对两变量进行简单线性回归分析的任务: 设法在分散的、具有线性关系的相关点之间配合一 条最优的直线,以表明两变量之间具体的变动关系。

  12. 估 计 回 归 线: 在两变量相关的散点图中,引出一条最优的直线,这条直线就是估计回归线。它表明了两变量数量变动的一般关系。 配合估计回归线的方程称为回归方程 方程式为: 回归系数b的经济涵义: 当自变量变动一个单位时,因变量的平均变动值。

  13. 配合直线回归方程的方法 配合直线回归方程的过程就是求解方程系数a、b 的过程,求解a、b的方法一般采用最小平方法。 用最小平方法配合回归直线的基本思想是: 在所有的相关点中,通过数学方法配合一条较为理 想的直线,这条直线必须满足两点: 1、原数列与趋势线的离差之和为零。即: 2、原数列与趋势线的离差平方和为最小值。即

  14. 解联立方程得到:

  15. 号 月产量 生产费用 1 2 3 4 5 6 7 8 1.2 2.0 3.1 3.8 5.0 6.1 7.2 8.0 62 86 80 110 115 132 135 160 1.44 4.00 9.61 14.44 25.00 37.21 51.84 64.00 3844 7396 6400 12100 13225 17424 18225 25600 74.4 172.0 248.0 418.0 575.0 805.2 972.0 1280.0 ∑ 36.4 880 207.54 104214 4544.6 根据前面例题资料配合生产费用依产量变化的回归方程: 统计学原理(第六讲)

  16. 计算得到: 则回归方程为: 回归系数b的涵义: 月产量每增加1000吨,生产费用平均增加12.9万元。 统计学原理(第六讲)

  17. 时间 人均年收入(元) 耐用消费品销售额(万元) 1990 1991 1992 1993 1994 1995 340 380 450 470 560 620 82 90 100 114 140 144 合计 2820 670 有某地区人均年收入与耐用消费品销售额资料如下: 要求:分析两变量相关密切程度,若为显著相关以上,则对两变量 进行回归分析。 统计学原理(第六讲)

  18. 答案:相关系数 r = 0.98 b = 0.24 a = -1.13 yc = -1.13+0.24x 回归系数b的涵义:人均年收入每增加一元,耐用消费品销售额平均增加0.24万元。

  19. 四 回归系数与相关系数的关系 因为: 即: 所以:

  20. 五 回归分析与相关分析的特点 1、回归分析必须区分自变量和因变量,而相关 分析不必区分。 2、回归分析的两个变量一个是自变量,一个是 因变量,通过给定自变量的值来推算因变量 的可能值;而相关分析的两个变量都是随机 变量。 3、回归分析中对于因果关系不甚明确的两个变量, 可以建立两个回归方程;而相关分析只能计算 出一个相关系数。 4、一种回归方程只能做一种推算,即只能给出自 变量的值来推算因变量的值,不能逆推。

  21. 六 估 计 标 准 误 1、估计标准误的涵义:教材P289 2、估计标准误的计算公式:教材P289 简化公式:教材P291

  22. 本章作业

  23. 判断题 1.正相关就是指因素标志和结果标志的数量变动方向都是上升的。( ) ×

  24. 2.只有当相关系数接近于+1时,才能说明两个变量之间存在高度相关关系。 ( ) ×

  25. 3.若变量x的值减少时变量y的值也减少,说明变量x与y之间存在正的相关关系。 ( ) √

  26. 4.回归系数b和相关系数r都可用来判断现象之间相关的密切程度。( ) ×

  27. 5.若直线回归方程y=170-2.5x,则变量x和y之间存在着负的相关关系。( ) √

  28. 单项选择 1.当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于( B ) A.相关关系 B.函数关系 C.回归关系 D.随机关系

  29. 2.现象之间的相互关系可以归纳出两种类型,即(A)2.现象之间的相互关系可以归纳出两种类型,即(A) A.相关关系和函数关系. B.相关关系和因果关系 C.相关关系和随机关系 D.函数关系和因果关系

  30. 3.相关系数的取值范围是(C) A.0≤r≤1 B.-1<r<1 C.-1≤r≤1 D.-1≤r≤0

  31. 4.变量之间的相关程度越低,则相关系数的数值(B) A.越小 B.越接近于0 C.越接近于-1 D.越接近于+1

  32. 5.回归分析中的两个变量( D ) A.都是随机变量 B.关系是对等的 C.都是给定的量 D.一个是自变量,一个是因变量

  33. 6.估计标准误说明回归直线的代表性.因此(B)6.估计标准误说明回归直线的代表性.因此(B) A.估计标准误数值越大,说明回归方程代表性越大 B.估计标准误数值越大,说明回归方程代表性越小 C.估计标准误数值越小,说明回归方程代表性越小 D.估计标准误数值越小,说明回归方程的实用价值小.

  34. 多项选择 1.下列属于正相关的现象是( ABE) A.家庭收入越多,其消费支出也越多 B.产量随工人劳动生产率的提高而增加 C.流通费用率随销售额的增加而减少 D.生产单位产品所耗的工时随劳动生产率的提高而减少 E.产品产量随生产用固定资产价值减少而减少

  35. 2.估计标准误是反映(ABDE ) A.回归方程代表性大小的指标 B.估计值与实际值误差程度的指标 C.自变量与因变量离散程度的指标 D.因变量估计值的可靠程度的指标 E.回归方程实用价值大小的指标

  36. 填空题 1.现象之间的相关关系按相关的程度分为完全相关、不完全 相关和不 相关;按相关的方向分为正相关和负相关;按相关的形式分为线性和非线性相关;按影响因素的多少分为单相关和复相关。

  37. 2.完全相关即是函数相关,其相关系数为 +1 或-1。

  38. 3.相关系数是在线性相关的条件下用来说明两个变量相关关系密切程度的统计分析指标。3.相关系数是在线性相关的条件下用来说明两个变量相关关系密切程度的统计分析指标。

  39. 4.一个回归方程只能作一种推算,即给出自变量的数字,估计因变量的可能值。4.一个回归方程只能作一种推算,即给出自变量的数字,估计因变量的可能值。

  40. 5.用来说明回归方程代表性大小的统计分析指标是估计标准误指标。

  41. 计算题:检查五位同学的统计学学习时间与成绩分数如下表所示:计算题:检查五位同学的统计学学习时间与成绩分数如下表所示: 学习时数(小时) 学习成绩(分) 4 40 6  60 7 50 10 70 13 90

  42. 要求: (1)计算相关系数 (2) 建立学习成绩与学习时间的直线回归方程

More Related