实验2-5 绘制序列分布图及序列经验分布检验
素材文件:sample/Example /table 2-3.wfl
多媒体教学文件:视频/实验2-5.mp4
实验基本原理
本实验是绘制序列的各种分布图以及对序列的经验分布进行正态检验。在绘制序列分布图的过程中,有几个经验分布函数需要介绍。
(1)经验累积分布(CDF)函数是指序列中观测值不超过给定值y的概率,即。
(2)经验生存函数是指序列中观测值大于给定值y的概率,即,其中为序列经验生成函数。
(3)对于0≤q≤1,序列x的分位数满足不等式:≤q或,分位数是累积分布函数的反函数。
实验目的与要求
1.实验目的
(1)通过本次实验掌握序列分布图、序列经验分布检验的基本思想和用途。
(2)熟悉序列的各种经验分布图,理解这些分布图的意义。
(3)掌握序列经验分布检验方法和操作过程,利用检验结果判断序列服从何种分布。
2.实验要求
(1)掌握绘制多种序列分布图的操作方法和过程。
(2)熟悉序列经验分布检验的操作步骤,理解检验输出结果的含义。
(3)熟悉使用序列分布图和经验分布检验方法,判断序列服从何种理论分布。
实验内容及数据来源
表2.3给出的是某百货公司1986年1月至1996年3月的月度销售额(Sales,单位为千美元)部分数据,完整的数据保存在本书下载资源Example文件夹的table 2-3.wfl工作文件中。
表2.3 某百货公司1986年至1990年的月度销售数据
根据这些销售数据绘制出其各种经验分布图,并判断销售数据是否服从正态分布。
实验操作指导
1.绘制CDF图
绘制序列sales的CDF图的主要过程如下:
01 单击序列sales窗口工具栏的View功能键,选择Graph,在弹出的对话框(见图2.22)的Specific选项组中选择Distribution,在右侧Distribution选项的下拉菜单中选择Empirical CDF。
对话框中的Graph Type选项组用来选择绘制统计图形的类型。在General选项下有基本图(Basic graph)和分组图(Categorical graph)两种选择;而在Specific选项下列出了所有的统计图形类型。
Options为用户提供了几种计算CDF的方法,这些方法的不同之处在于如何调整针对CDF计算的非连续性(由于序列观测值是离散的值),这些不同将随着样本数的增加而变得非常微小。一般情况下,用户不需要使用Options功能。
02 单击OK按钮,屏幕会弹出序列sales的累积分布图,如图2.23所示。对于其他两种分布图,用户可以参照上述步骤迚行绘制。
图2.23中两边的红色曲线表示两倍标准误差置信带。由于序列的观测值是离散的,因此其经验累积分布图呈现出“锯齿”状,但随着样本量增大,分布图将变得平滑。
图2.22 绘制CDF图的对话框
图2.23 序列sales的经验CDF图
2.Quantile-Quantile图
以选定序列的分位数为横轴,以某一理论分布或其他序列的分位数为纵轴,可绘制分位数-分位数图(Quantile-Quantile,简称QQ图),QQ图可以用来比较两个分布。如果所比较的两个分布是相同的或非常接近,则QQ图中的散点将在同一直线上。绘制序列sales QQ图的主要过程如下:
01 单击序列sales窗口工具栏的View功能键,选择Graph,在弹出的对话框(见图2.22)的Specific选项组中选择Quantile-Quantile。
在Q-Q graph后面可以选择的下拉菜单用于选择纵轴,可以是理论分布(Theoretical),也可以是用于对比的序列(Symmetry),如图2.24所示。
图2.24 选择纵轴
如果使用默认的Theoretical选项,则单击Options按钮,弹出的对话框如图2.25所示。对话框上面的Distribution选项组可选择某种理论分布或者某个序列进行比较,有正态分布(Normal)、指数分布(Exponential)、逻辑分布(Logistic)、均匀分布(Uniform)、极大值分布(Extreme-Max)、极小值分布(Extreme-Min)、卡方分布(Chi-Square)、帕雷托分布(Pareto)、威布尔分布(Weibull)、伽马分布(Gamma)和学生t分布(Student's t)。用户在分布下的选项栏中可以设置理论分布的参数。
在Quantial Method选项后的下拉菜单中可选择计算CDF的方法。
02 在Distribution选项组中选择Normal,然后单击OK按钮,屏幕会弹出如图2.26所示的QQ图。
图2.25 绘制QQ图对话框
图2.26 序列sales与正态分布比较的QQ图
在图2.26所示的QQ图中,序列sales的分位数散点并没有全部落在回归直线上,因此可以认为序列sales观测值的分布并不接近正态分布。
3.序列经验分布检验(Empirical Distribution Tests)
用户可以使用经验分布检验来初步判断所选定序列的观测值大致服从哪种理论分布。对序列sales进行经验分布检验的主要过程如下:
01 单击序列sales窗口工具栏的View功能键,选择Descriptive Stats & Tests| Empirical Distribution Tests命令,会弹出如图2.27所示的对话框,该对话框需要用户输入待检验的理论分布。
图2.27 经验分布检验对话框
对话框中的Distribution下拉列表提供可选择的分布,包括正态分布(Normal)、卡方分布(Chi-Square)、指数分布(Exponential)、极大值分布(Extreme-Max)、极小值分布(Extreme-Min)、伽马分布(Gamma)、逻辑分布(Logistic)、帕累托分布(Pareto)、均匀分布(Uniform)以及威布尔分布(Weibull)。其下方的文本框用于显示所选定的某种分布的概率密度函数表达式,如在下拉列表中选择Normal分布,则该文本框显示正态分布概率密度函数。
Parameters选项组用于输入所选定分布的参数或参数的表达式,如选定正态分布时,可以输入均值()和标准差()。用户也可以不输入参数,EViews将自动估计分布中的参数。在Estimation Options选项卡中可以设置估计中的一些选项,如迭代控制(Iteration)、优化算法(Optimization Algorithm)以及迭代的起始值(Starting Values)。对于这些选项,用户一般不需要修改。
在Distribution下拉列表中选择Normal项,且不输入正态分布的参数值(和),然后单击OK按钮,屏幕会显示如图2.28所示的检验输出结果。
从上至下,图2.28所示的检验结果主要有两部分。第一部分显示序列经验分布检验所使用的检验方法、相应统计量的值及其概率值。对于这些统计检验方法,有兴趣的读者可以参考有关的统计学图书。这几种检验方法都显示序列sales的经验分布并服从正态分布。此次检验过程中没有在对话框设置分布的参数,因此第二部分显示参数估计结果,包括参数估计值、标准误差(Std. Error)、z统计量(z-Statistic)及其概率值(Prob.)。Method显示参数估计所使用的方法:最大似然法(Maximum Likelihood),对数似然比(Log likelihood)= -1142.158。
图2.28 序列sales的正态分布检验