实验2-3 单个总体的假设检验
素材文件:sample/Example/table 2-1.wfl
多媒体教学文件:视频/实验2-3.mp4
实验基本原理
单个总体的假设检验是利用某些检验统计量对样本的均值、方差以及分位数进行检验,其中经常使用的是均值检验和方差检验。单个总体检验又分为简单假设检验和分组齐性检验,其中分组齐性检验是对由分组变量划分得到的序列各子集进行检验。
这些假设检验关键的问题是如何构建检验统计量。在简单假设检验中,对单个总体进行均值检验的统计量有Z统计量和t统计量。若单个总体方差已知,则采用Z统计量检验,即:
若单个总体方差未知,则采用t统计量检验,即:
其中,,表示样本方差。
在简单假设检验中,对单个总体进行方差检验的统计量为:
在分组齐性检验中,对序列各子集进行均值差异性检验的统计量为:
其中,和分别表示组间样本方差和组内样本方差,k为用分组变量对选定序列进行分组的组数,n为序列观测值数。
实验目的与要求
1.实验目的
(1)通过本次实验,掌握均值检验、方差检验和分组检验的基本思想和用途。
(2)根据实际情况设定均值检验方法,区别方差已知和未知情况下均值检验统计量的异同。
(3)理解单个总体假设检验的判断依据,利用检验结果对原假设进行判断。
2.实验要求
(1)能够构建单个总体假设检验的检验统计量,尤其是均值检验时需要根据总体标准差是否已知而选择不同的检验统计量。
(2)掌握单个总体均值检验和方差检验的操作过程。
(3)理解均值检验和方差检验的输出结果,对检验的原假设做出合理的判断。
(4)掌握分组均值检验的方法及检验输出结果,根据检验统计量的概率值判断单个总体各组之间的均值是否存在显著差异。
实验内容及数据来源
本实验将对实验2-1中的序列CONS的观测值进行简单均值检验、方差检验以及分组均值检验。其中,均值检验的原假设(Null Hypothesis)为15000;方差检验的原假设为2+e08。根据EViews的检验输出结果判断总体的均值是否为15000,方差是否为2+e08。对序列CONS分组均值检验中,分组变量是GDP,原假设是:序列CONS的各组均值没有显著差异。检验水平都为0.01。
实验操作指导
1.均值检验和方差检验
利用EViews执行简单的均值检验和方差检验的主要过程如下:
01 打开序列CONS,然后单击其窗口工具栏中的View功能键,幵选择Descriptive Statistics& Tests | Simple Hypothesis命令,屏幕会显示如图2.15所示的对话框。
02 对话框选项设定。用户需要在对话框的Test value选项组中输入待检验的均值、方差以及中位数。例如本实验中,在Mean编辑框中输入“15000”,在Variance编辑框中输入“200000000”,表示均值检验和方差检验的原假设分别为15000,2+e08(科学计数法)。
进行均值检验时,若知道单个总体方差,则在如图2.15所示的对话框右侧的Enter s.d.if known编辑框中输入相应的标准差,均值检验时采用t检验,否则采用Z检验。本实验中采用Z检验。
03 单击OK按钮,屏幕会显示如图2.16所示的检验输出结果。
图2.15 简单假设检验对话框
图2.16 均值检验和方差检验输出结果
图2.16所示的检验输出结果从上至下分为三部分。第一部分显示检验的基本信息,包括执行此次EViews操作的名称(Hypothesis Testing for CONS)、执行操作的日期时间、样本范围、包含的观测值数以及检验名称;第二部分“Test of Hypothesis:Mean=15000.00”显示的是均值检验结果;第三部分“Test of Hypothesis:Variance=2.00e+08”显示方差检验结果。
在均值检验结果中,Method列显示均值检验方法:t-statistic(t检验),且t-统计量-0.0050510,其相应的概率0.9960~0.01,因此不能拒绝原假设15000。在方差检验结果中,Method列显示检验方法:Variance Ratio(方差比检验),统计量值20.93823,其对应的概率0.4008~0.01,因此也不能拒绝原假设2+e08。
说明
①进行样本均值检验时,若总体的标准差已知,则采用Z检验;否则采用t检验。图2.15所示对话框右侧的Enter s.d if known编辑框仅仅用于均值检验。对于均值检验,无论是Z检验还是t检验,EViews给出的都是双侧检验结果。
②进行方差检验时,当方差比(Variance Ratio)统计量对应的概率P<0.5时,EViews计算结果中给出的概率是右侧概率值;当P≥0.5时,EViews计算结果中给出的概率是左侧概率值。
2.分组均值齐性检验
分组齐性检验主要利用方差分析方法得到各组(由分组变量对选定的序列进行划分而得到的子集)数据的组内差异和组间差异,EViews同时给出F统计量以及相应的概率值。对序列CONS进行分组均值检验的主要过程如下:
01 在序列CONS窗口工具栏中,单击View功能键,幵选择Descriptive Statistics & Tests | Equality Test by Classification命令,屏幕会显示如图2.17所示的对话框。
在对话框左上角的Series/Group for classify编辑框输入分组变量。Test equality of选项组用于选择待检验的统计量,有均值(Mean)、中位数(Median)以及方差(Variance)。对话框右上角的NA handling选项用于选择对样本缺失值的处理方式,若选中Treat NA as category,则处理过程中将排除缺失值。
图2.17 分组均值检验对话框
02 在Series/Group for classify编辑框中输入“gdp”,幵在Test equality of选项组选中Mean,其他选项采用默认设置,然后单击OK按钮,会显示如图2.18所示的检验结果。
从上至下,图2.18所示的检验结果主要分为三部分:第一部分显示分组均值检验所使用的方法及有关检验统计量;第二部分显示方差分析结果;第三部分显示序列CONS的分组统计描述。在第一部分中,Method列显示检验所采用的方法:Anova F-statistic(方差分析F-统计量)。由于分组变量gdp被划分为4个区间,序列CONS被分为4个组(k=4),因此F-统计量的自由度df为(3,17)。F-statistic=124.8549,相应的概率为p=0.0000,远远小于通常意义上的高度显著水平0.01,因此可以拒绝原假设“序列CONS各组的均值不存在显著差异”,即至少在99%的置信水平上可以认为序列CONS的4个组(子集)的均值之间存在显著差异。
在第二部分中,Analysis of Variance显示方差分析的详细结果。有差异来源(Source of Variation)、组间差异(Between)和组内差异(Within)。组间差异的自由度df=3(df=k-1),组内差异的自由度df=17(df=n-k-1)。Sum of Sq.所在列是样本方差,组间方差为4.01E+09,组内方差为1.82E+08,组间方差大于组内方差,因此,总方差主要来源于组间方差。Mean Sq.(平均方差)等于方差除以对应的自由度,即Mean Sq.=Sum of Sq./df。
Category Statistics部分显示分组的结果,和实验2-1所介绍的序列分组统计描述相同。
图2.18 分组均值检验结果