Stata统计分析与行业应用案例详解(第2版)
上QQ阅读APP看书,第一时间看更新

6.2 实例二——多因素方差分析

6.2.1 多因素方差分析的功能与意义

多因素方差分析的基本思想基本等同于单因素方差分析,不同之处在于其研究的是两个或者两个以上因素对于试验结果的作用和影响,以及这些因素共同作用的影响。多因素方差分析所要研究的是多个因素的变化是否会导致试验结果的变化。由于三因素以及三因素以上方差分析较少用到,因此下面我们以双因素方差分析为例进行介绍。

6.2.2 相关数据来源

【例6.2】将40只大鼠随机等分为4组,每组10只,进行肌肉损伤后的缝合试验。处理方式由两个因素组合而成,A因素为缝合方法,分别为外膜缝合和内膜缝合,记作a1、a2; B因素为缝合后的时间,分别为缝合后1月和2月,记作b1、b2。试验结果为大鼠肌肉缝合后肌肉力度的恢复度(%),如表6.2所示,从而考察缝合方法和缝合后时间对肌肉力度的恢复度是否有显著影响。

表6.2 大鼠肌肉缝合后肌肉力度的恢复度测量数据

6.2.3 Stata分析过程

在用Stata进行分析之前,我们要把数据录入到Stata中。本例中有3个变量,分别是肌肉力度的恢复度、缝合方法和缝合后时间。我们把肌肉力度的恢复度变量设定为renew,把缝合方法变量设定为method,并且其中的缝合方法a1设定为1、缝合方法a2设定为2,把缝合后时间变量设定为time,并且其中的缝合方法b1设定为1、缝合方法b2设定为2,变量类型及长度采取系统默认方式,然后录入相关数据。相关操作我们在第1章中已有详细讲述。录入完成后数据如图6.4所示。

图6.4 案例6.2数据

先做一下数据保存,然后开始展开分析,步骤如下:

进入Stata 14.0,打开相关数据文件,弹出主界面。

在主界面的“Command”文本框中输入如下命令(旨在考察缝合方法和缝合后时间对肌肉力度的恢复度是否有显著影响):

    anova     renew   method   time   method#   time

设置完毕后,按键盘上的回车键,等待输出结果。

6.2.4 结果分析

在Stata 14.0主界面的结果窗口我们可以看到如图6.5所示的分析结果。

图6.5 分析结果图

通过观察分析结果,我们可以看出共有40个有效样本参与了方差分析。


●可决系数(R-squared)以及修正的可决系数(Adj R-squared)都非常接近于1,这说明模型的拟合程度很高,也就是说模型的解释能力很强。

●Prob > F Model=0.0000,说明模型的整体是很显著的。

●Prob > F method =0.0000,说明变量method的主效应是非常显著的。

●Prob > F time =0.0000,说明变量time的主效应也是非常显著的。

●Prob > F method#time = 0.1506,说明变量method与变量time的交互效应是不显著的。这一点也可以从下面的命令中得到验证。


在主界面的“Command”文本框中分别输入下列命令并按键盘上的回车键:

    test   method
    test   time
    test   method#time

可以得到如图6.6所示的结果。

图6.6 分析结果图

在上面的例子中,因为变量method与变量time的交互效应是不显著的,所以我们可以构建更加简单的不包含两者交互效应的方差分析模型。在主界面的“Command”文本框中输入下列命令并按键盘上的回车键:

    anova     renew   method   time

可以得到如图6.7所示的结果。

图6.7 分析结果图

至此,我们以两个因素介绍了多因素方差分析的应用。事实上,多因素方差分析的模型构建是非常灵活的,如果存在3个或者3个因素以上,我们要纳入任何一项变量间的交互效应,则只需指定有关变量名称,并且之间用“#”连接(注意,之前的很多Stata版本用的是“*”)即可。

6.2.5 案例延伸

上述的Stata命令比较简洁,分析过程及结果已达到解决实际问题的目的。但是Stata 14.0的强大之处在于,它同样提供了更加复杂的命令格式以满足用户更加个性化的需求。

例如,我们只针对renew变量大于11的观测样本进行多因素方差分析,那么操作命令即为:

    anova     renew   method   time   method#   time   if   renew>11

在命令窗口输入命令并按回车键进行确认,结果如图6.8所示。

图6.8 分析结果图

通过观察分析结果,我们可以看出共有34个有效样本参与了方差分析。


●可决系数(R-squared)以及修正的可决系数(Adj R-squared)都非常接近于1,这说明模型的拟合程度很高,也就是说模型的解释能力很强。

●Prob > F Model=0.0000,说明模型的整体是很显著的。

●Prob > F method =0.0000,说明变量method的主效应是非常显著的。

●Prob > F time =0.0000,说明变量time的主效应也是非常显著的。

●Prob > F method#time = 0.8482,说明变量method与变量time的交互效应是不显著的。