第 6 章 SPSS 的方差分析
第 6 章 SPSS 的方差分析. 为什么称为方差分析? 因为在检验均数间差异是否具有统计学意义的过程中,实际上是通过比较方差而得到的。. 方差分析概述. 方差分析的目的: 推断 两组或多组资料的总体均数是否相同 检验 两个或多个样本均数的差异是否有统计学意义。. 方差分析概述. 用方差分析对资料进行统计推断之前应注意其 使用条件 ,包括: 具有可比性。 若资料中各组均数本身不具可比性则不适用方差分析。
第 6 章 SPSS 的方差分析
E N D
Presentation Transcript
第6章 SPSS的方差分析 为什么称为方差分析? 因为在检验均数间差异是否具有统计学意义的过程中,实际上是通过比较方差而得到的。
方差分析概述 • 方差分析的目的: • 推断两组或多组资料的总体均数是否相同 • 检验两个或多个样本均数的差异是否有统计学意义。
方差分析概述 用方差分析对资料进行统计推断之前应注意其使用条件,包括: • 具有可比性。若资料中各组均数本身不具可比性则不适用方差分析。 • 具有正态性。要求被检验的各个总体都服从正态分布。即偏态分布资料不适用方差分析。对偏态分布的资料应考虑用对数变换、平方根变换、倒数变换、平方根反正弦变换等变量变换方法变为正态或接近正态后再进行方差分析。 • 具有方差齐性。要求各个总体的方差相等(方差齐性)。即若组间方差不齐则不适用方差分析。
方差分析概述 • 方差分析主要用于: • 均数差别的显著性检验; • 分离各有关因素并估计其对总变异的作用; • 分析因素间的交互作用; • 方差齐性检验。
方差分析概述 • 基本假设 • 观测变量各总体应服从正态分布(用卡方检验) • 观测变量各总体的方差应相等 • 检验2个或2个以上的独立样本均数间的差异。 • 方差分析分为: • 单因素方差分析 • 多因素无重复试验的方差分析 • 多因素重复试验方差分析 • 协方差分析
因素 • 影响农作物产量的最重要的因素? • 品种 • 施肥量 • 地域 • 影响广告效果的最主要的因素? • 广告的形式 • 地区的规模 • 选择的栏目 • 播放的时间 • 播放的频率 取得最佳搭配组合?
单因素方差分析(One-way ANOVA) (1)概念 • 单因素方差(一维方差)分析,检验一个“因素”的各“水平”的观测值的均值之间的差异。 • 因素所处的状态称为“水平” 。 • 明确观测变量和控制变量 例如:考察不同的“地域”对农作物产量的影响(品种和施肥量不变) • 观测变量:农作物产量。 • 控制变量:“地域”(因素) • 华南,华东,东北(3个水平,3个总体的比较)
方差分析基本概念 方差分析技巧是认为不同的处理组的均数间的差异来源有两个: 组内差异(随机误差):可能是由于一些误差造成的差异。 组内差异用SSE组内表示,它是各组均值与组内变量的偏差平方和的总和。 组间差异(处理条件):不同的处理方法造成的差异。 组间差异用SSA组间表示,它是变量各组均值与总均值偏差的平方和。
例 • 某公司为了研究不同的包装方式对一种商品的促销作用,在3个城市选了5个商场试销1个月,每个城市的某商场采用同种包装方式,各城市采用不同的包装方式,试销结果如表所示(单因素无重复实验)
方差分析的假设检验 • H0:3个总体平均数都相等。 • 显著性水平0.05检验,Sig=0.853>0.05,接受原假设H0 。
方差分析 例 例如:一位教师对三个班级的同学分别用三种不同的教学方法授课,用期末考试成绩来检验三种不同的教学法是否产生不同的效果。 观测变量:期末考试成绩 控制变量(因素):教学法,每个方法表示一个水平,共三个“水平”。 假设其他因素都是相同的。
(2)方差分析的假设检验 H0:假设各样本的均数都相同。 即,如果μ1,μ2,μ3分别代表所对应的3个总体的均值,假设H0:μ1=μ2=μ3,概率用Sig表示。用0.05显著性水平检验,如果Sig<0.05,拒绝原假设H0 ,否则Sig>0.05,接受原假设H0 。 续前3
(3)方差分析步骤 ①输入数据。 不能将三个方法定义为三个变量,三个方法应定义为一个因素变量。例如:(文件:students-report.sav)。 数据形式与独立样本T检验一样 方差分析 操作
②Analyze→Compare Means→One-Way ANOVA; ③ Dependent List:成绩; ④ Factor:方法; ⑤OK(按默认值)。 方差分析 操作 (续前)
输出结果 • 组间的自由度2;组间差异72;组间的均方差36;组内的自由度9;组内差异46;组内的均方差5.111;总自由度11;总的差异118。F=7.0435; • 对应的概率:F Sig=0.014<0.05;
(4)输出结果说明: 组间的自由度(D.F)为2; 组间差异(Sum of Squares)SSA组间=72; 组间的均方差(Mean Squares)= SSA组间/D.F=72/2=36。 组内的自由度(D.F)为9; 组内差异(Sum of Squares)SSE组内=46; 组内的均方差(Mean Squares)= SSE组内/D.F=46/9=5.111。
总自由度(D.F)=组间的自由度+组内的自由度=2+9=11总自由度(D.F)=组间的自由度+组内的自由度=2+9=11 总的差异(Sum of Squares)=组间的差异+组内的差异=72+46=118。 对假设H0组间均值无显著性差异计算的F值: F=组间的均方差/组内的均方差=36/5.1111=7.0435; 对应的概率:F Sig=0.014<0.05; 因此得出结论假设不成立,三种不同的教学方法有不同的教学效果。 (4)输出结果说明(续前)
解: (1)H0:假设3种不同的教学方法效果相同。 (2)用方差分析Analyze→Compare Means→One-Way ANOVA; (3)Sig=0.014<0.05,拒绝H0假设,三种不同的教学方法效果有显著差异。
用默认值,单因素方差分析只能给出是否有显著差异,如果存在差异,最好进行两两的组间均值比较。用默认值,单因素方差分析只能给出是否有显著差异,如果存在差异,最好进行两两的组间均值比较。 • Options: • Descriptive输出描述统计量 • Homogeneity-of-variance:方差齐性检验 • Means polt:均值分布图
应用举例 • 例如: 分析不同的收入水平(高,中、低)的人,看电视的时间是否有差异? • 待检假设为:
应用举例(续1)-操作步骤 观测变量:看电视时间; 控制变量:收入水平(因素) 其中1=高收入;2=中收入;3=低收入; 操作步骤: 1.检验不同的收入水平下每个总体是否服从正态分布(要求较弱) 2.检验每个总体方差是否相等(要求较强) 3.满足以上2个条件,方差分析
应用举例(续2) N表示“收入水平” • 检验每个总体是否服从正态分布 • (1)筛选Data→Select Cases,If N=1 • (2)Analyze→Nonparametric Tests →1-Sample K-S,选中 Normal (原假设H0 :服从正态分布) • 再做(1),(2),求N=2,N=3 N=1,sig=0.880>0.05,收入服从正态分布 N=2,sig=0.998>0.05,收入服从正态分布 N=3,sig=0.988>0.05,收入服从正态分布
应用举例(续3) • 检验各个总体的方差是否相等(齐)、方差分析 步骤1:Analyze→Compare Means→One-Way ANOVA(单因素方差分析) 步骤2:“收入” →Dependent List(观测变量) “收入水平”→Factor(控制变量) 步骤3:Option: • Descriptive:输出统计量,用于比较均值 • Homogeneity of variance test:检验方差是否相等(原假设H0:方差齐) • Means Plots:输出均值散点图
3.方差分析(结果分析) (1)方差齐性检验 结果sig=0.787>0.05,各总体方差无显著差异。
应用举例(续4) (2)方差分析结果 Sig=0.005<0.05,拒绝原假设,不同的收入水平的人,看电视的时间存在显著差异。从Descriptives 看出”中收入”的均收视时间2.95明显高于其他人群。
单因素方差分析中------多重比较检验 • 方差分析只能判断控制变量是否对观测量产生了显著影响,不能判断其中哪个水平作用明显,哪个水平不显著,这需要多重比较检验。 • 方法1:独立样本T检验 • 高收入和中收入,看电视时间是否有差异? • 高收入和低收入,看电视时间是否有差异? • 中收入和低收入,看电视时间是否有差异? • 方法2: 方差分析中 • Post Hoc:指定一种多重比较检验 • Lsd • Bonferferroni • ……
Lsd:最小显著差法,默认α=0.05 从下表看出只有低收入和高收入看电视时间无显著差异。
举例(教材) • 例题 某企业在制定某商品的广告策略时,对不同广告形式在不同的地区的广告效果进行评估,分析 • 不同的地区对销售额的影响 • 不同的广告形式对销售额的影响 数据文件:方差分析(广告城市与销售额).sav • X1广告形式(报纸;广播;宣传品;体验) • X2地区(18个) • X3销售额 见P148
广告形式对销售额的单因素方差分析结果 地区对销售额的单因素方差分析结果
简单方差分析(多因素方差分析) • 当因素变量有两个或两个以上时,用简单方差分析。 • H0:各控制变量不同水平下观测变量各总体的均值无显著差异.
双因素无重复试验的方差分析 例1 假设有四位教师对三个班级的同学分别用三种不同的教学方法授课,用期末考试成绩检验: • 四位教师教学效果的差别“评价老师”; • 三种教学法效果的差别“评价教学法”。
因素1:教师;四个教师共四个水平。 • 因素2:教学法;三种教学法共三个水平。 • 假设其他因素都是相同的。
(1)方差分析的假设检验 在两个因素的分析中,要检验两个零假设。 • 检验因素A的主效应是否显著,则: • 假设1:不同的教师之间对考试成绩的总体均值没有差异。 • 检验因素B的主效应是否显著,则: • 假设2:不同的教学法之间对考试成绩的总体均值没有差异。
用0.05显著性水平检验,如果P<0.05,拒绝原假设,否则P>0.05,接受原假设。用0.05显著性水平检验,如果P<0.05,拒绝原假设,否则P>0.05,接受原假设。 • 假设检验是建立在总的差异的分析基础之上,将它分解为由第一个因素A引起的差异、第二个因素B引起的差异以及误差E共三个部分。
因素A的偏差平方和: • 因素B的偏差平方和:
数据总的差异,即总偏差平方和: SA、SB是因素A、B的主效应; SE是误差效应。
(2)方差分析步骤 ①输入数据 例如: students-report-2.sav
②Analyze→General Linear Model→Univariate ③观测值变量“成绩” →Dependent ④水平变量“教师” →Fixed Factor ⑤水平变量“教学法” →Random Factor ⑥OK。
(3)输出结果说明: • 两个因素教师和教学法的偏差平方和分别是SA=3.333和SB=72; • 误差平方和SE=42.667; • DF列为自由度。 • Mean Square 为均方差=(Sum of Squares)/DF。 • 对假设考试成绩的总体均值无显著性差异计算的F值(F Ratio)=因素的均方差/误差的均方差。
第一个因素的F值=1.11/7.11=0.156; • 第二个因素的F值=36/7.11=5.062。 • 它们对应的成绩总体均值无显著性差异概率(F Sig )分别是0.922和0.052>0.05,因此得出结论两个假设均成立,即三种不同的教学方法的教学效果相同,不同的教师的教学效果一样。
作业练习六 文件“方差分析(广告城市与销售额).sav” 1、 “广告形式”和“地区”对“销售额”的影响,进行方差分析(过程可参考书中的单因素方差分析过程)。 2、写出相关的分析过程,以及结论。