2.6 对四类离差平方和[1]的补充说明
进行ANCOVA, MANOVA等分析时,需要计算各种离差平方和。SPSS, SAS等统计软件根据研究的各种假定以及由多个效应组成的列联表单元格内次数均衡的程度,设计了四种计算离差平方和的方法,分别称为类型Ⅰ,Ⅱ,Ⅲ及类型Ⅳ平方和(TypeⅠ,Ⅱ,Ⅲ,ⅣSum of Squares)。前三种方法适用于单元格内不存在缺失数据的情况,类型Ⅳ适用于单元格内存在缺失数据的情况,其中类型Ⅲ是默认值。
类型Ⅰ此方法也称为平方和分级解构法。类型Ⅰ的一个明显特点是各因素效应的离差平方和依照因素投入次序的不同而不同。具体来说,该方法计算每一项因素的效应时只针对它前面的效应项进行调整。类型Ⅰ离差平方和常用于:①均衡的ANOVA模型,其中任何一个主效应均先于所有一阶交互效应之前指定和计算,任何一阶交互效应均在二阶交互作用之前指定并计算;②多项式回归模型,其中低阶项均在高阶项之前指定和计算;③纯嵌套模型,其中第一个指定的效应嵌套在第二个指定的效应中,第二个指定的效应嵌套在第三个指定的作用中,依此类推(此嵌套形式只能通过语法执行)。
类型Ⅱ此方法用在为所有其他“相应的”效应进行调节的模型中计算某个效应的离差平方和。不同的统计分析方法中,“相应的”效应的定义范围略有不同。例如在ANOVA中,所谓某个因素主效应的“相应的”效应是指不包含正在检验的效应以及该效应与其他效应的交互作用。但在ANCOVA中,因素的“相应的”效应却包含正在被检查的效应与协变量的交互作用。
类型Ⅱ常用于:①均衡的ANOVA模型;②任何只有主效应的模型,任一回归模型;③纯嵌套设计(此嵌套形式能通过使用语法执行)。
类型Ⅲ此方法与类型Ⅱ一样,计算离差平方和时不受因素投入次序的影响。此种方法计算得到的某效应的离差平方和是剔除了该效应之后剩余的全部效应的离差平方和,以及全体效应与该效应的交互作用(如果存在)离差平方和的调整结果。众多使用者认为类型Ⅲ离差平方和对单元格无缺失值的非均衡模型也有用。在单元格无缺失值的因素设计中,此方法等同于Yates的加权均值平方技术。类型Ⅲ常用于:①任何在类型Ⅰ和类型Ⅱ中列出的模型;②任何无单元格缺失值的均衡或非均衡模型。
类型Ⅳ此方法是针对单元格存在缺失值的情况而设计的。类型Ⅳ常用于:①任何在类型Ⅰ和类型Ⅱ中列出的模型;②任何带有空白单元格的均衡或非均衡模型。
针对上述介绍,我们用表2.2的模拟数据来查看类型Ⅰ,Ⅱ,Ⅲ离差平方和的计算结果以及协变量的检验结果。因为该组数据的分组是均衡的,所以不考查类型Ⅳ的离差平方和。
表2.8是四张检验组间与组内效应的结果表,共同特点是各表内均含自变量“组”与协变量X的交互效应。表2.8(a)和表2.8(b)是考查不同投入顺序的Ⅰ型离差平方和结果;表2.8(c)和表2.8(d)是分别用Ⅱ型、Ⅲ型方法计算离差平方和及检验结果。
首先查看表2.8(a)、表2.8(b)。由于投入的顺序不同((a)表是先协变量后自变量,(b)表则相反),它们的Ⅰ型离差平方和是不同的。例如(a)表内协变量效应是336.876,而(b)表内是313.228;自变量也是如此。除此之外,其他数值是一致的。
表2.8(c)是用Ⅱ型方法计算的离差平方和,由于无投入顺序的差异故只列一表。比较表2.8(c)与2.8(a)中各效应的差别,主要是截距和组效应数值上的差异。表2.8(d)是用Ⅲ型方法计算的离差平方和。与2.8(a)至2.8(c)各表相比,截距、X、组效应的离差平方和都不相等。但是,表2.8(a)至表2.8(d)内的“组*X”的交互效应、误差效应、总计、校正总计以及校正模型的离差平方和都相同,说明当列联表各格内个体次数比较均衡一致时,这几项效应的离差平方和不受类型方法的影响。根据交互效应的假设检验结果,接受回归系数同质性的假设,可以进行下一步的协方差分析。
表2.8(a)协方差分析中组间与组内的效应检验(Ⅰ型平方和,先投入协变量X)
表2.8(b)协方差分析中组间与组内的效应检验(Ⅰ型平方和,先投入组效应)
表2.8(c)协方差分析中组间与组内的效应检验(Ⅱ型平方和,效应投入无先后影响)
表2.8(d)协方差分析中组间与组内的效应检验
表2.9是重新设计的无“组*X”交互效应离差平方和的计算结果。表2.9(a)、表2.9(b)是用Ⅰ型方法计算离差平方和,(a)表是先投入协变量,(b)表是先投入自变量。显然Ⅰ型方法的特点是变量投入次序不同,离差平方和值不同。同时比较表2.9(a)至表2.9(d),其中误差、总计、校正总计以及校正模型的离差平方和全都相同,说明无论用何种类型方法计算,这几项效应的离差平方和均无变化。
联系2.2小节在介绍协方差分析的前提假设与检验统计量时,表2.6中误差的离差平方和为294.05,与表2.9(a)至表2.9(d)的误差离差平方和(294.022)基本一致;因素A,即自变量(组)的离差平方和为228.91,与表2.9(a)至表2.9(d)的值(228.936)也基本一致。结合表2.5,我们知道,总离差平方和(SSY=859.83)分别减去误差和自变量的平方和,即
此值正好与表2.9(a)中协变量X的离差平方和相等。由此可知,2.2小节中我们先剔除协变量的影响后再求调整后的方差分析统计量,其本质是用类型Ⅰ的方法求离差平方和,这当然可行。但是若研究问题再复杂些,例如有两个协变量时,用类型Ⅰ的方法就会出现不同答案。
表2.9(a)协方差分析中组间与组内的效应检验(Ⅰ型,先投入协变量)
表2.9(b)协方差分析中组间与组内的效应检验(Ⅰ型,先投入自变量)
表2.9(c)协方差分析中组间与组内的效应检验(Ⅱ型)
表2.9(d)协方差分析中组间与组内的效应检验