第九章两因素的方差分析（ two-factors analysis of variance ）或两种方式分组的方

第九章两因素的方差分析（two-factors analysis of variance）或两种方式分组的方差分析（two-way classification analysis of variance）一、模型的类型及交互作用的概念在实际工作中，经常会遇到两种或两种以上的因素，共同影响实验结果的情况。例如，一组病人同时服用两种药物，每一种药物又有不同的剂量（水平），如A药物有5个水平，B药物有3个水，共有5×3＝15个剂量水平。需要15名病人参加实验，每人接受一种水平组合，象这样的分组方式称为交叉（cross）分组。

上面讲过，因素可分作固定因素和随机因素。在两因素实验中:上面讲过，因素可分作固定因素和随机因素。在两因素实验中: • 当两个因素都是固定因素时，称为固定模型（fixed model）。 • 两个因素均为随机因素时，称为随机模型（random model）。 • 一个因素是固定因素，另一个因素是随机因素时，称为混合模型（mixed model）。这三种模型虽然在计算方法上没有多大不同，但在检验以及对结果解释上却截然不同。尤其是在两因素之间存在交互作用时，不同类型模型的区别就更明显。为了下面叙述方便，介绍主效应与交互作用两个基本概念。

由于因素水平的改变而造成因素效应的改变，称为该因素的主效应（main effect）。例如有下面一组实验，A因素有两个水平，A1和A2；B因素也有两个水平，B1和B2。当A因素从第一个水平变化到第二个水平时，A因素的主效应为A2水平的平均效应减去A1水平的平均效应。

同样，B因素的主效应： 若A、B之间不存在交互作用，则有时会发现，某一因素在另一因素的不同水平上所产生的效应不同。例如：

A（在B1水平上）＝A2B１－A1B1＝28－18＝10 A（在B2水平上）＝A2B2－A1B2＝22－30＝－8 可以明显看出：A的效应依B的水平而不同。这时我们说：在A和B因素见存在交互作用。交互作用的大小可用来估计。上例的A、B间的交互作用：AB＝18＋22―30―28＝—18。有时交互作用相当大，因素的主效应相对来说变得相当小。在上面例子中，A因素的主效应：A＝（28＋22）／2－（18＋30）／2＝1，与交互作用的绝对值18相比已经相当小，这时可认为不存在主效应。

当因素间存在交互作用时，对因素间交互作用的了解比只了解因素的主效应重要得多。因此，在两因素方差分析中，分解出因素的交互作用十分必要。两因素间是否存在交互作用，有专门的统计判断方法，一般情况下，可以根据专业知识判断。另外，做图法也能提供一些帮助。将上面两表的数据，可以做以下两图（图2－1）。

B2 B1 B1 B2 A1 A1 A2 A2 a. 不存在交互作用 b. 存在交互作用图2—1 因素间交互作用的图示

当A、B之间不存在交互作用时，从B1变化到B2是不依A水平的不同而变化，所以B1－B1，B2－B2两线平行。当存在交互作用时，Ａ的效应依Ｂ的水平而不同，所以B1－B1，B2－B2两线不平行。直观图可以帮助判断因素之间是否存在交互作用，但在处理数据时只凭图象是不行的，需要经过严格的数据分析之后，才能最后断定。

两因素实验的典型设计是：假定A因素有a水平，B因素有b水平，则每一次重复都包括ab次实验，并设实验重复次数n次，χijk表示A因素的第i水平，B因素第j水平和第k次重复的观察值。数据将以下表的形式出现。两因素实验的典型设计是：假定A因素有a水平，B因素有b水平，则每一次重复都包括ab次实验，并设实验重复次数n次，χijk表示A因素的第i水平，B因素第j水平和第k次重复的观察值。数据将以下表的形式出现。表2－7中A和B可以是固定因素，也可以是随机因素，因而引出三种不同的统计模型。

表2－7 两因素交互分组实验的一般格式

表2－7中的各种符号做如下说明：ci··表示A因素第i水平的所有观察值的和；c·j·表示B因素第j水平的所有观察值的和；cij·表示A的第i水平和B的第j水平的所有观察值的和；c···表示所有观察值的综合。用公式表示为：

二、固定效应模型 1. 有重复实验时有重复实验时，观察值可以以下线性统计模型描述：其中，m是总体效应；a i是A因素第i水平的真正效应；bj是B因素第j水平的真正效应；（ab）i j是在ai和bj之间的交互作用的效应；ei j k是随机误差成份。当两因素均为固定因素时，各处理效应是距总平均效应的离差。因此，

交互作用的效应也是固定的， eij是相互独立且服从N（0，s2）的随机变量（2·24）因实验共有n次重复，所以实验的总次数为abn次。

交互分组两因素固定效应模型的方差分析的零假设为： 方差分析的基本思想仍然是将总平方和分解。

于是，总平方和可分解为：由于A因素所引起的平方和SSA ，B因素所引起的平方和SSB，A、B交互作用所引起的平方和SSAB及误差平方和SSe。分别是：

从(2·32)式可以看出，为了得到误差平方和，至少要重复两次。有了误差平方和，才能把误差与交互作用分解开。从(2·32)式可以看出，为了得到误差平方和，至少要重复两次。有了误差平方和，才能把误差与交互作用分解开。与每一平方和所相应的自由度为： A a－1 B b－1 AB交互作用（a－1）（b－1）误差 ab（n－1）总和 abn－1

其中总自由度、A因素自由度和B因素自由度比较简单，分别为abn－1，a－１和b－1。交互作用的自由度，是两个因素全部水平的组合数减1，再减A、B主效应自由度，即（ab－1）―（a―1）―（b―1）＝（a―1）（b―1）。误差自由度在每一因素组合内是 n－1，共有ab种组合，故为ab（n－1）。各项的均方分别为：

两因素固定模型方差分析表如下： 表2－8 固定模型方差分析表（因素A、B固定型）

实际计算时，可按下述方式进行。 其中c2···／abn称为校正项，用C表示。

为了得到SSAB需分两步计算。首先，由重复间的平均数，求出次总平方和（subtotal sumof squares）SSST，这一平方和由三部分构成：由此可以得出，AB交互作用平方和SSAB，而

另一种计算交互作用平方和的方法，是通过计算重复间平方和得到误差平方和，另一种计算交互作用平方和的方法，是通过计算重复间平方和得到误差平方和，再由总平方和减去A因素、B因素及误差平方和，剩余的便是交互作用平方。例2.3为了从三种不同原料和三种不同发酵温度中，选出最适的条件，设计了一个两因素试验。并得到以下结果（表2－9）：

表2－9 用不同原料与不同温度发酵的酒精产量

在这个试验中，温度和原料均为固定因素。每一处理有4次重复。因此可按上面叙述过的方法分析。将表中的每一数字均减去30，列成表2－10.1，由表2－10.1中，可以计算出及

表2－10.1 发酵实验方差分析计算表

利用χij·列列成表2－10.2。 表2－10.2 发酵实验方差分析表

由表2－10.2 中可以计算出

表2－11 发酵实验方差分析表 列成方差分析表： ** a＝0.01 * a＝0.05 原料和温度在α＝0.01水平上拒绝H0；交互作用在α＝0.05水平上拒绝H0。因此酒精的产量不仅与原料与温度有关，而且与两者的交互作用也有关。

三、随机效应模型 如果因素A和因素B都是随机因素，则构成随机效应模型。例如，将同一种作物种在不同地块上，并施以不同数量的农家肥，考查不同地块和不同施肥量对作物产量的影响。不同地块是随机选出来的，属随机因素。农家肥的肥力水平，是很难人为控制的，即使施用相同的数量,其效应值也不会完全相同。因此，肥料也书随机因素。随机效应模型的每一观察值，可用以下线性统计模型描述：

零假设分别是： 方差分析的方法与固定模型的分析一样，分别计算出SST、SSA、SSB和SSe。对H03：s2a b＝0的检验统计量应当是（具(a－1) (b－1)，ab(n－1)自由度）：

与F(a－1) (b―1), ab ( n―1), a 做比较，当F＜Fa时，接受H03：s2a b＝0的假设；若F＞Fa ，拒绝H03：s2a b＝0的假设。对H01：s2a＝0的假设，使用统计量（具(a－1)，(a－1) (b－1)自由度）与F(a－1), (a―1) (b―1), a 做比较，当F＜Fa时，接受H01：s2a＝0的假设；若F＞Fa ，拒绝H01：s2a ＝0的假设。

对H02：s2b＝0的假设，使用统计量（具(b－1)，(a－1) (b－1)自由度）与F(b－1), (a―1) (b―1), a 做比较，当F＜Fa时，接受H02：s2b＝0的假设；若F＞Fa ，拒绝H02：s2b ＝0的假设。

随机效应模型的方差分析表如下： 表2－14 随机效应模型方差分析表（因素A、B随机型）

例 2.6为了研究不同地块中施用不同数量农家肥对作物产量的影响，设计了一个两因素试验。试验结果列在下表中。解前面已经说过，这是一随机模型。随机模型的各项平方和的计算与固定模型是一样的。将上表中的cijk每一个均减去9.5列成下表：

表2－15.1 作物产量方差分析计算表

表2－15.2 作物产量方差分析计算表 利用χijk列，列成下表：由表2－15.1 计算出

由表2－15.2 计算出

列成方差分析表: ** a＝0.01 从以上方差分析表中，可以看出所选择的不同地块对产量没有显著影响。但不同施肥两对产量的影响极为显著。

四、混合模型 在两因素交叉分组实验中，若一个因素(如A因素)是固定型，另一个因素(如B因素)是随机型，则称为混合模型。在混合模型中，每一观察值 χijk的线性统计模型为：其中ai是固定效应，bj是随机效应，交互作用(αb)ij，被认定随机效应。因为固定因素的全部交互作用效应之和为0，所以在固定因素的某个水平上，交互作用的成分不是独立的。

对于H01：αi＝0的检验的统计量为（具a―1，(a―1)(b―1)自由度）： 对于H02：sb2＝0的检验的统计量为（具b―1，ab(n―1)自由度）：

对于H03：σ2αβ＝0的检验的统计量为（具(a－1)(b―1)，ab(n―1)自由度）： 混合模型方差分析表如下：表2－16 混合模型方差分析表（A固定，B随机）

例2·7表2－17 所列出的数据是四个受试者在四种速度下工作，即正常速度的60％、80％、100％、120％所得到的能量消耗的比值，试验共有16种处理，每一处理重复观察2次，共做32次观察。表2－17　四个受试者在四种速度下工作的能量消耗

解首先，看因素的类型。因素A是从60～120％这个范围内，人为地选出的四个水平，这四个水平是可以严格控制的，所以因素A为固定型；因素B的四个水平，是从受试者人群中随机抽取的，所以因素B为随机型。本试验属于混合效应模型。具体计算过程不再重复，下面给出方差分析表表 2－18　能量消耗实验方差分析表

首先，检验假设 因为F＞F9，16，0.05，所以A、B之间存在交互作用。检验 F＜F3，16，0.05，所以实验对象个体之间的差异不显著。

最后，检验 F＜F3，16，0.01，接受H01。因素A是不显著的。在这四种速度下，工作的能量消耗没有显著不同。要提醒大家的是，在混合模型的方差分析时，正确区分因素的类型，正确地使用检验的统计量是非常重要的。

在随机效应模型和混合效应模型中，不设置重复，同样会有固定效应模型中的问题，即因素的假互作用与实验误差无法区分，全部归于误差项。特别是混合模型中，随机因素的各水平之间实际存在的差异，往往检验不出来，结果降低了实验的可靠性。因此，在条件允许的情况下，不论哪一种模型，最好都设重复。

五、两个以上因素的方差分析 六、缺失数据的估计弥补缺失数据的原则：使补上缺失的数据之后，所得到的误差平方和最小。七、数据变换对数变换、平方根变换、反正弦变换等等。

第九章两因素的方差分析（ two-factors analysis of variance ）或两种方式分组的方