1 / 47

第九章 两因素的方差分析 ( two-factors analysis of variance ) 或两种方式分组的方

第九章 两因素的方差分析 ( two-factors analysis of variance ) 或两种方式分组的方 差分析 ( two-way classification analysis of variance ) 一、 模型的类型及交互作用的概念

fathia
Télécharger la présentation

第九章 两因素的方差分析 ( two-factors analysis of variance ) 或两种方式分组的方

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第九章 两因素的方差分析(two-factors analysis of variance)或两种方式分组的方 差分析(two-way classification analysis of variance) 一、 模型的类型及交互作用的概念 在实际工作中,经常会遇到两种或两种以上的因素,共同影响实验结果的情况。例如,一组病人同时服用两种药物,每一种药物又有不同的剂量(水平),如A药物有5个水平,B药物有3个水,共有5×3=15个剂量水平。需要15名病人参加实验,每人接受一种水平组合,象这样的分组方式称为交叉(cross)分组。

  2. 上面讲过,因素可分作固定因素和随机因素。在两因素实验中:上面讲过,因素可分作固定因素和随机因素。在两因素实验中: • 当两个因素都是固定因素时,称为固定模型(fixed model)。 • 两个因素均为随机因素时,称为随机模型(random model)。 • 一个因素是固定因素,另一个因素是随机因素时,称为混合模型(mixed model)。 这三种模型虽然在计算方法上没有多大不同,但在检验以及对结果解释上却截然不同。尤其是在两因素之间存在交互作用时,不同类型模型的区别就更明显。为了下面叙述方便,介绍主效应与交互作用两个基本概念。

  3. 由于因素水平的改变而造成因素效应的改变,称为该因素的主效应(main effect)。例如有下面一组实验,A因素有两个水平,A1和A2;B因素也有两个水平,B1和B2。当A因素从第一个水平变化到第二个水平时,A因素的主效应为A2水平的平均效应减去A1水平的平均效应。

  4. 同样,B因素的主效应: 若A、B之间不存在交互作用,则 有时会发现,某一因素在另一因素的不同水平上所产生的效应不同。例如:

  5. A(在B1水平上)=A2B1-A1B1=28-18=10 A(在B2水平上)=A2B2-A1B2=22-30=-8 可以明显看出:A的效应依B的水平而不同。这时我们说:在A和B因素见存在交互作用。交互作用的大小可用 来估计。上例的A、B间的交互作用:AB=18+22―30―28=—18。有时交互作用相当大,因素的主效应相对来说变得相当小。在上面例子中,A因素的主效应:A=(28+22)/2-(18+30)/2=1,与交互作用的绝对值18相比已经相当小,这时可认为不存在主效应。

  6. 当因素间存在交互作用时,对因素间交互作用的了解比只了解因素的主效应重要得多。因此,在两因素方差分析中,分解出因素的交互作用十分必要。两因素间是否存在交互作用,有专门的统计判断方法,一般情况下,可以根据专业知识判断。另外,做图法也能提供一些帮助。将上面两表的数据,可以做以下两图(图2-1)。

  7. B2 B1 B1 B2 A1 A1 A2 A2 a. 不存在交互作用 b. 存在交互作用 图2—1 因素间交互作用的图示

  8. 当A、B之间不存在交互作用时,从B1变化到B2是不依A水平的不同而变化,所以B1-B1,B2-B2两线平行。当存在交互作用时,A的效应依B的水平而不同,所以B1-B1,B2-B2两线不平行。直观图可以帮助判断因素之间是否存在交互作用,但在处理数据时只凭图象是不行的,需要经过严格的数据分析之后,才能最后断定。

  9. 两因素实验的典型设计是:假定A因素有a水平,B因素有b水平,则每一次重复都包括ab次实验,并设实验重复次数n次,χijk表示A因素的第i水平,B因素第j水平和第k次重复的观察值。数据将以下表的形式出现。两因素实验的典型设计是:假定A因素有a水平,B因素有b水平,则每一次重复都包括ab次实验,并设实验重复次数n次,χijk表示A因素的第i水平,B因素第j水平和第k次重复的观察值。数据将以下表的形式出现。 表2-7中A和B可以是固定因素,也可以是随机因素,因而引出三种不同的统计模型。

  10. 表2-7 两因素交互分组实验的一般格式

  11. 表2-7中的各种符号做如下说明:ci··表示A因素第i水平的所有观察值的和;c·j·表示B因素第j水平的所有观察值的和;cij·表示A的第i水平和B的第j水平的所有观察值的和;c···表示所有观察值的综合。用公式表示为:

  12. 二、 固定效应模型 1. 有重复实验时 有重复实验时,观察值可以以下线性统计模型描述: 其中,m是总体效应;a i是A因素第i水平的真正效应;bj是B因素第j水平的真正效应;(ab)i j是在ai和bj之间的交互作用的效应;ei j k是随机误差成份。当两因素均为固定因素时,各处理效应是距总平均效应的离差。因此,

  13. 交互作用的效应也是固定的, eij是相互独立且服从N(0,s2)的随机变量 (2·24) 因实验共有n次重复,所以实验的总次数为abn次。

  14. 交互分组两因素固定效应模型的方差分析的零假设为: 方差分析的基本思想仍然是将总平方和分解。

  15. 于是,总平方和可分解为:由于A因素所引起的平方和SSA ,B因素所引起的平方和SSB,A、B交互作用所引起的平方和SSAB及误差平方和SSe。分别是:

  16. 从(2·32)式可以看出,为了得到误差平方和,至少要重复两次。有了误差平方和,才能把误差与交互作用分解开。从(2·32)式可以看出,为了得到误差平方和,至少要重复两次。有了误差平方和,才能把误差与交互作用分解开。 与每一平方和所相应的自由度为: A a-1 B b-1 AB交互作用 (a-1)(b-1) 误差 ab(n-1) 总和 abn-1

  17. 其中总自由度、A因素自由度和B因素自由度比较简单,分别为abn-1,a-1和b-1。交互作用的自由度,是两个因素全部水平的组合数减1,再减A、B主效应自由度,即(ab-1)―(a―1)―(b―1)=(a―1)(b―1)。误差自由度在每一因素组合内是 n-1,共有ab种组合,故为ab(n-1)。各项的均方分别为:

  18. 两因素固定模型方差分析表如下: 表2-8 固定模型方差分析表(因素A、B固定型)

  19. 实际计算时,可按下述方式进行。 其中c2···/abn称为校正项,用C表示。

  20. 为了得到SSAB需分两步计算。首先,由重复间的平均数,求出次总平方和(subtotal sumof squares)SSST, 这一平方和由三部分构成: 由此可以得出,AB交互作用平方和SSAB, 而

  21. 另一种计算交互作用平方和的方法,是通过计算重复间平方和得到误差平方和,另一种计算交互作用平方和的方法,是通过计算重复间平方和得到误差平方和, 再由总平方和减去A因素、B因素及误差平方和,剩余的便是交互作用平方。 例2.3为了从三种不同原料和三种不同发酵温度中,选出最适的条件,设计了一个两因素试验。并得到以下结果(表2-9):

  22. 表2-9 用不同原料与不同温度发酵的酒精产量

  23. 在这个试验中,温度和原料均为固定因素。每一处理有4次重复。因此可按上面叙述过的方法分析。将表中的每一数字均减去30,列成表2-10.1,由表2-10.1中,可以计算出

  24. 表2-10.1 发酵实验方差分析计算表

  25. 利用χij·列列成表2-10.2。 表2-10.2 发酵实验方差分析表

  26. 由表2-10.2 中可以计算出

  27. 表2-11 发酵实验方差分析表 列成方差分析表: ** a=0.01 * a=0.05 原料和温度在α=0.01水平上拒绝H0;交互作用在α=0.05水平上拒绝H0。因此酒精的产量不仅与原料与温度有关,而且与两者的交互作用也有关。

  28. 三、 随机效应模型 如果因素A和因素B都是随机因素,则构成随机效应模型。例如,将同一种作物种在不同地块上,并施以不同数量的农家肥,考查不同地块和不同施肥量对作物产量的影响。不同地块是随机选出来的,属随机因素。农家肥的肥力水平,是很难人为控制的,即使施用相同的数量,其效应值也不会完全相同。因此,肥料也书随机因素。 随机效应模型的每一观察值,可用以下线性统计模型描述:

  29. 零假设分别是: 方差分析的方法与固定模型的分析一样,分别计算出SST、SSA、SSB和SSe。 对H03:s2a b=0的检验统计量应当是(具(a-1) (b-1),ab(n-1)自由度):

  30. 与F(a-1) (b―1), ab ( n―1), a 做比较,当F<Fa时,接受H03:s2a b=0的假设;若F>Fa ,拒绝H03:s2a b=0的假设。 对H01:s2a=0的假设,使用统计量(具(a-1),(a-1) (b-1)自由度) 与F(a-1), (a―1) (b―1), a 做比较,当F<Fa时,接受H01:s2a=0的假设;若F>Fa ,拒绝H01:s2a =0的假设。

  31. 对H02:s2b=0的假设,使用统计量(具(b-1),(a-1) (b-1)自由度) 与F(b-1), (a―1) (b―1), a 做比较,当F<Fa时,接受H02:s2b=0的假设;若F>Fa ,拒绝H02:s2b =0的假设。

  32. 随机效应模型的方差分析表如下: 表2-14 随机效应模型方差分析表(因素A、B随机型)

  33. 2.6为了研究不同地块中施用不同数量农家肥对作物产量的影响,设计了一个两因素试验。试验结果列在下表中。 解 前面已经说过,这是一随机模型。随机模型的各项平方和的计算与固定模型是一样的。将上表中的cijk每一个均减去9.5列成下表:

  34. 表2-15.1 作物产量方差分析计算表

  35. 表2-15.2 作物产量方差分析计算表 利用χijk列,列成下表: 由表2-15.1 计算出

  36. 由表2-15.2 计算出

  37. 列成方差分析表: ** a=0.01 从以上方差分析表中,可以看出所选择的不同地块对产量没有显著影响。但不同施肥两对产量的影响极为显著。

  38. 四、 混合模型 在两因素交叉分组实验中,若一个因素(如A因素)是固定型,另一个因素(如B因素)是随机型,则称为混合模型。在混合模型中,每一观察值 χijk的线性统计模型为: 其中ai是固定效应,bj是随机效应,交互作用(αb)ij,被认定随机效应。因为固定因素的全部交互作用效应之和为0,所以在固定因素的某个水平上,交互作用的成分不是独立的。

  39. 对于H01:αi=0的检验的统计量为(具a―1,(a―1)(b―1)自由度): 对于H02:sb2=0的检验的统计量为(具b―1,ab(n―1)自由度):

  40. 对于H03:σ2αβ=0的检验的统计量为(具(a-1)(b―1),ab(n―1)自由度): 混合模型方差分析表如下: 表2-16 混合模型方差分析表(A固定,B随机)

  41. 例2·7表2-17 所列出的数据是四个受试者在四种速度下工作,即正常速度的60%、80%、100%、120%所得到的能量消耗的比值,试验共有16种处理,每一处理重复观察2次,共做32次观察。 表2-17 四个受试者在四种速度下工作的能量消耗

  42. 首先,看因素的类型。因素A是从60~120%这个范围内,人为地选出的四个水平,这四个水平是可以严格控制的,所以因素A为固定型;因素B的四个水平,是从受试者人群中随机抽取的,所以因素B为随机型。本试验属于混合效应模型。具体计算过程不再重复,下面给出方差分析表 表 2-18 能量消耗实验方差分析表

  43. 首先,检验假设 因为F>F9,16,0.05,所以A、B之间存在交互作用。检验 F<F3,16,0.05,所以实验对象个体之间的差异不显著。

  44. 最后,检验 F<F3,16,0.01,接受H01。因素A是不显著的。在这四种速度下,工作的能量消耗没有显著不同。要提醒大家的是,在混合模型的方差分析时,正确区分因素的类型,正确地使用检验的统计量是非常重要的。

  45. 在随机效应模型和混合效应模型中,不设置重复,同样会有固定效应模型中的问题,即因素的假互作用与实验误差无法区分,全部归于误差项。特别是混合模型中,随机因素的各水平之间实际存在的差异,往往检验不出来,结果降低了实验的可靠性。因此,在条件允许的情况下,不论哪一种模型,最好都设重复。

  46. 五、两个以上因素的方差分析 六、缺失数据的估计 弥补缺失数据的原则:使补上缺失的数据之后,所得到的误差平方和最小。 七、数据变换 对数变换、平方根变换、反正弦变换等等。

More Related