袁卫《统计学》(第4版)配套题库【名校考研真题+课后习题+章节题库+模拟试题】
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2015年中央财经大学432统计学[专业硕士]考研真题及详解

一、单项选择题(每小题2分,共30分)

1.为了解大学生的消费状况,调查员在食堂门口任意拦截100名学生进行了问卷调查。关于这种调查方式以下说法正确的是(  )。

A.这是分层抽样

B.这是方便抽样

C.这是简单随机抽样

D.这是配额抽样

【答案】B

【解析】方便抽样是调查过程中由调查员依据方便的原则,自行确定入抽样本的单位的非概率抽样方法。例如,调查员在街头、公园、商店等公共场所进行拦截式的调查;厂家在出售产品的柜台前对路过的顾客进行调查,等等。题中,在食堂门口任意拦截100名学生进行调查即为方便抽样。

2.某企业男性职工占80%,月平均工资为450元,女性职工占20%,月平均工资为400元,该企业全部职工的平均工资为(  )。

A.425元

B.430元

C.435元

D.440元

【答案】D

【解析】企业全部职工的平均工资=男性职工比例×男性月平均工资+女性职工比例×女性月平均工资=80%×450+20%×400=440(元)。

3.某种商品销售额增长了5%,商品零售价格增长2%,则商品销售量增长(  )。

A.7%

B.10%

C.2.94%

D.3%

【答案】C

【解析】销售额指数=销售量指数×销售价格指数,故销售量指数=(1+5%)/(1+2%)=102.94%,则销售量增长率=销售量指数-100%=2.94%。

4.抽样误差(  )。

A.既可以避免,也可以控制

B.既不可以避免,也不可以控制

C.可以避免,但不可以控制

D.不能避免,但可以控制

【答案】D

【解析】抽样误差是由抽样的随机性引起的样本结果与总体真值之间的误差。抽样误差是由抽样的随机性带来的,只要采用概率抽样,抽样误差就不可避免。但概率抽样的误差是能够计量且可以得到控制的,可通过增大样本容量或改善抽样方法来降低其抽样误差。因此,抽样误差不能避免,但可以控制。

5.如果偏态系数>0,表明该组数据是(  )。

A.尖峰分布

B.扁平分布

C.左偏分布

D.右偏分布

【答案】D

【解析】偏态系数计算公式为:

当分布对称时,SK=0;当SK为正值时,表示正离差值较大,可以判断为正偏或右偏;反之,当SK为负值时,表示负离差值较大,可判断为负偏或左偏。

6.总体X的分布律为:

已知取得样本值:1,2,1,则参数θ的极大似然估计为(  )。

A.2/3

B.5/6

C.1/6

D.1/3

【答案】B

【解析】由X的分布律可得:

所以极大似然函数为:

对该似然函数取对数并求导后,解得关于参数的方程为:(9-x1-x2-x3)/θ=(x1+x2+x3)/(1-θ),代入样本值:1,2,1,解得参数的极大似然估计值为5/6。

7.在假设检验中,如果我们相信原假设是真的,而犯第二类错误又不会造成太大的影响,此时,检验的显著性水平应该取(  )。

A.大些

B.小些

C.无法确定

D.等于0.05

【答案】B

【解析】由于犯一类错误的概率和犯第二类错误的概率是此消彼长的关系,题中我们相信原假设为真,并且第二类错误的并不会造成较大影响,因此如果要拒绝原假设应该提高更显著的证据,所以犯第一类错误的概率应取小些。而在假设检验中检验的显著性水平即为犯第一类错误的概率,故显著性水平应该取小些。

8.某班学生的平均成绩是80分,标准差是10分。如果己知该班学生的考试分数为对称分布,可以判断成绩在70~90分之间的学生大约占(  )。

A.95%

B.89%

C.68%

D.99%

【答案】C

【解析】由“3σ”原则知P(70,90)=P(μ-σ,μ+σ)=0.6826,所以约为68%。

9.对于线性回归模型为了进行统计推断,通常假定模型中各随机误差项的方差(  )。

A.均等于0

B.均相等

C.不相等

D.均不为0

【答案】B

【解析】线性回归模型对随机误差项的假定为:随机误差项ε是一个零均值、同方差并服从正态分布的随机变量,即ε~N(0,σ2),且各随机误差项互不相关。故B项正确。

10.若皮尔逊相关系数为零,则表明两个变量之间(  )。

A.相关程度很低

B.不存在任何关系

C.不存在线性相关关系

D.存在非线性相关关系

【答案】C

【解析】相关系数r是x与y之间线性关系的一个度量,它不能用于描述非线性关系。r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。

11.我国的商品零售价格指数是采用(  )方法编制的。

A.固定权数加权算术平均指数

B.固定权数加权调和平均指数

C.数量指标综合指数

D.质量指标综合指数

【答案】A

【解析】商品零售价格指数是指反映一定时期内商品零售价格变动趋势和变动程度的相对数。我国商品零售价格指数采用固定权数的加权算术平均公式计算;又由于权数直接影响指数的可靠性,因此每年要根据居民家庭收支调查的资料调整一次权数。

12.在抽样推断中,样本统计量是(  )。

A.未知但确定的量

B.一个已知的量

C.随机变量

D.唯一的

【答案】C

【解析】统计量是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于样本是随机的,因此统计量作为样本的函数是随机变量。

13.以下关于非抽样误差的说法正确的是(  )。

A.全面调查中也会存在非抽样误差

B.增大样本容量可以降低非抽样误差

C.采用分层抽样方法可以显著降低非抽样误差

D.以上都不对

【答案】A

【解析】A项,非抽样误差是指除抽样误差之外的,由其他原因引起的样本观察结果与总体真值之间的差异,无论是概率抽样、非概率抽样,或是在全面调查中,都有可能产生非抽样误差。BC两项,增大样本容量和采用分层抽样方法都是降低抽样误差的方法。

14.两个变量的样本相关系数等于-0.3,对相关系数进行双侧检验的P值等于0.032,则以下说法正确的是(  )。

A.在5%的显著性水平下可以拒绝总体相关系数为0的零假设

B.在5%的显著性水平下可以拒绝总体相关系数不等于0的零假设

C.在1%的显著性水平下可以拒绝总体相关系数为0的零假设

D.在1%的显著性水平下可以拒绝总体相关系数不等于0的零假设

【答案】A

【解析】相关系数显著性检验为H0:ρ=0;H1:ρ≠0。检验P值0.032<0.05,故拒绝原假设,即在5%的显著性水平下可以拒绝总体相关系数为0的零假设。

15.多元线性回归模型中修正的判定系数(  )。

A.大于等于0,小于等于1

B.大于等于-1,小于等于1

C.可能出现负值

D.可能大于1

【答案】C

【解析】修正的判定系数是用样本量n和自变量的个数k去调整R2,计算出调整的多重判定系数记为Ra2,其计算公式为:

如果R2的数值比较小,而模型包含的自变量数目较多时,即在拟合极差时,可能出现负值。此时规定Ra2=0。

二、多项选择题(每小题3分,共15分。在备选答案中有两个或更多选项是正确的,多选、少选均不得分)

1.下面关于假设检验的陈述中正确的有(  )。

A.拒绝原假设意味着原假设一定不正确

B.拒绝原假设意味着原假设不正确的可能性很大

C.不拒绝原假设意味着原假设就是正确的

D.不拒绝原假设意味着没有证据证明原假设是错误的

E.样本量越大就越有可能拒绝原假设

【答案】BDE

【解析】假设检验是依据样本提供的信息进行判断的,即由部分来推断总体,因而判断有可能正确,也有可能不正确。所以拒绝原假设只是意味着原假设不正确的可能性很大,不拒绝原假设只是意味着没有证据证明原假设是错误的。样本容量越大越容易拒绝H0,根据标准化Z统计量的计算表达式,当n越大时,Z值越大越容易落在拒绝域。

2.在方差分析的数据结构模型中,需假设随机误差ε(  )。

A.服从正态分布

B.相互独立

C.数学期望为0

D.方差为非常数

E.方差为常数

【答案】ABCE

【解析】在方程分析的数据结构模型中随机误差项的假定为:误差项ε是一个期望值为0的随机变量,即E(ε)=0;对于所有的x值,ε的方差σ2都相同;误差项ε是一个服从正态分布的随机变量,且独立,即ε~N(0,σ2)。

3.下列有关统计量的性质,不属于大样本性质的是(  )。

A.无偏性

B.一致性

C.有效性

D.方差齐性

E.平稳性

【答案】ACDE

【解析】统计量的大样本性质包括:一致性和渐近正态性等。无偏性是指作为估计量的样本统计量的期望等于总体参数真值;有效性针对于无偏估计量而言,对于若干个无偏估计量来说,方差越小越有效;方差齐性即同方差的统计假设;平稳性是描述时间序列的一个性质;它们均与样本量无关,不属于大样本性质。但渐近无偏性和渐近有效性属于大样本性质。

4.关于假设检验的两类错误,下列说法正确的有(  )。

A.第一类错误被称为弃真错误

B.第一类错误被称为纳伪错误

C.第二类错误被称为纳伪错误

D.第二类错误是原假设不正确,但却被接受的错误

E.第一类错误是原假设正确,但却被拒绝的错误

【答案】ACDE

【解析】假设检验所犯的错误有两种类型,第I类错误是原假设H0为真却被拒绝了,犯这种错误的概率用α表示,所以又称α错误或弃真错误;第II类错误是原假设为伪却没有拒绝,犯这种错误的概率用β表示,所以又称β错误或取伪错误。

5.X1,…,Xn是一样本,总体密度函数为:f(x,θ)=x·θ(1+θ)xθ1(1-x),0<x<1,θ>0。则Tn=2X(_)/(1-X(_))作为θ的估计量是(  )。

A.矩估计

B.不是矩估计

C.有效的

D.非有效的

E.随机的

【答案】AE

【解析】根据据估计量的计算方法有:

所以Tn=2X(_)/(1-X(_))是矩估计;矩估计是以大样本为应用对象的,只有在样本容量n较大时,才能保障它的优良性,因而在未知样本容量的情况下有效性也是未知的;矩估计法就是利用样本矩来估计总体中相应的参数,而样本是随机抽取的,所以矩估计量也是随机的。

三、简答题(每小题10分,共40分)

1.试简述假设检验的P值的含义及用P值进行假设检验相对于传统方法的优点,并简述用P值做假设检验的步骤。

答:(1)假设检验的P值的含义

P值是当原假设为真时出现样本观察结果或更极端结果的概率。它是观察到的实际显著性水平。

(2)使用P值进行假设检验相对于传统方法的优点

P值法给出了拒绝H0的最小显著性水平。

检验结论对任何统计量均适用,不需改变。

在改变显著性水平时,无须重新计算P值。

(3)使用P值做假设检验的步骤

根据实际问题建立检验假设H0和H1

构建检验统计量,根据观测样本计算在原假设成立条件下检验统计量的值,并给出得到样本观察结果或更极端结果的概率即P值。

根据选定的显著性水平,决定拒绝或不能拒绝H0。当P值小于给定的显著性水平时,拒绝原假设。

2.直方图是对数据进行描述分析的一种常用方法,其实质可以看作对数据分布密度的估计,试根据你对直方图方法的理解,简述直方图作为数据分布密度估计的不足之处。

答:直方图密度估计是较为传统的非参密度估计方法,通常的做法:将数据值覆盖的数据区间分成几个等子区间(bin);一个数据值落到这个相应的子区间,这个子区间块的高度就相应的加一个单位的高度。利用直方图估计密度函数还是有不完美的地方:密度函数是不平滑的;密度函数受子区间宽度影响很大,若宽度取0.5,5等构造出的密度函数显然与宽度取2的有很大差异;当数据维数是1,2维情况下,直方图的使用是很普遍的,但是在数据维数再增加时,这种方法有局限性。

3.简述统计指数的概念及其种类。

答:(1)统计指数是分析社会经济现象数量变化的一种重要统计方法,它是测定多项内容数量综合变动的相对数。这个概念中包含两个要点:第一个要点是指数的实质是测定多项内容,第二个要点是其表现形式为动态相对数。

(2)从不同的角度出发,统计指数可以划分为以下几种主要类型。

按照考察对象的范围不同,可分为个体指数和总指数。个体指数是考察总体中个别现象或个别项目数量变动的相对数;总指数是综合反映多种项目数量变动的相对数。

按照所反映指标的性质不同,可分为数量指标指数和质量指标指数。数量指标指数是反映数量指标变动程度的相对数;质量指标指数是反映品质指标变动程度的相对数。

按照计算形式不同,可分为简单指数和加权指数。简单指数把计入指数的各个项目的重要性视为相同;加权指数则对计入指数的各个项目依据重要程度赋予不同的权数,再进行计算。

上述各种分类是从不同的角度对统计指数所作的一般分类,也可以交叉进行复合分类,如在个体指数和总指数中再区分数量指标指数和质量指标指数等。

4.简述多元线性回归模型中存在高度多重共线性的后果,常用的检验方法以及补救办法。

答:当回归模型中两个或两个以上的自变量彼此相关时,则称回归模型中存在多重共线性。

(1)多元线性回归模型中存在高度多重共线性产生的后果

当出现较为严重的多重共线性时,各共线性解释变量回归系数的估计值会有很大的方差,即估计的精度降低。

解释变量对被解释变量的影响无法测定。

在进行回归系数的显著性检验时,会增大犯第二类错误的概率。

(2)多重共线性常用的检验方法

计算模型中各对自变量之间的相关系数,并对各相关系数进行显著性检验。如果有一个或多个相关系数是显著的,就表示模型中所使用的自变量之间相关,因而存在多重共线性问题。

经验判别。具体来说,如果出现下列情况,暗示存在多重共线性:

a.当模型的线性关系检验(F检验)显著时,几乎所有回归系数β1的t检验却不显著。

b.回归系数的正负号与预期的相反,明显违背经济常理。

c.容忍度与方差扩大因子(VIF)。某个自变量的容忍度等于1减去该自变量为因变量而其他k-1个自变量为预测变量时所得到的线性回归模型的判定系数,即1-Ri2。容忍度越小,多重共线性越严重。通常认为容忍度小于0.1时,存在严重的多重共线性。方差扩大因子等于容忍度的倒数,即VIF=1/(1-Ri2)。显然,VIF越大多重共线性越严重。一般认为VIF大于10时,存在严重的多重共线性。

(3)多重共线性的补救办法

将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关。

增加样本容量,即加入额外信息。

对模型施加某些约束条件或将模型适当变型。

四、(每小题4分,共12分)对某地区居民家庭月平均生活费用进行抽样调查,样本容量为400户,其中有80户为贫困户,样本平均数为1250元,标准差为140元。以95%的置信度推断(已知Z0.025=1.96):

1.该地区居民家庭月平均生活费用的置信区间(保留2位小数)。

2.若贫困率定义为贫困户占总户数的比重,试给出贫困率的置信区间(保留2位小数)。

3.要使月平均生活费用的最大容许误差不超过10元,则至少应抽多少户做样本。

解:1.在大样本条件下,总体均值的抽样分布为:

因而,该地区居民家庭月平均生活费用μ的95%的置信区间为:

2.样本的贫困率P(∧)=80/400=0.2,而在大样本条件下,总体比例的抽样分布为:

因而,该地区贫困率的95%的置信区间为:

3.当月平均生活费用的最大容许误差不超过10元时,由样本量确定公式有:

因此,至少应抽753户做样本。

五、(共12分)某酒店拟为每个客房配备一台小型冰箱,冰箱的节电性能是拟考虑的一个重要指标。在采购招标的过程中,共收到三种品牌的冰箱销售商的投标,该酒店分别从三种品牌的冰箱中各抽取了5台进行测试,得到各种品牌冰箱每天的耗电量(千瓦时)的平均数和标准差如下表。

1.给定显著性水平为0.05,试检验三种品牌的冰箱的平均耗电量有无差异?(8分)

2.假设各品牌的报价相同,问该酒店应选择采购哪一种品牌的冰箱?(4分)(注:F0.05(2,12)=3.89)

解:1.根据题意,假设检验问题如下:

H0:μ1=μ2=μ3

H1:μ1,μ2,μ3不全相等

总体均值为:

计算相关指标为:

故检验统计量为:

故拒绝原假设,认为三种品牌的冰箱的平均耗电量存在显著差异。

2.假设各品牌的报价相同,该酒店应选择采购C品牌的冰箱。因为C品牌冰箱的平均耗电量最少,同时耗电量标准差最小,平均耗电量的置信区间最窄。

六、(每小题4分,共12分)设随机变量X1,X2相互独立,其概率密度分别为:

求:

(1)E(X1X2

(2)E(X1+X2

(3)E(2X1-3X22

解:(1)因为随机变量X1,X2相互独立,所以有:

(2)

(3)

七、(10分)随机抽取某种炮弹9发做实验,测得炮口速度的样本标准差S=3(m/s),设炮口速度服从正态分布,求这种炮弹的炮口速度的方差σ2的置信度为0.95的置信区间:(已知:

解:由于,故总体方差σ2在1-α置信水平下的置信区间为:

根据显著性水平α=0.05和自由度n-1=9-1=8,查χ2分布表得:

所以,总体方差σ2的置信区间为:8×9÷17.535≤σ2≤8×9÷2.18。

即4.106≤σ2≤33.028,这种炮弹的炮口速度的方差σ2的置信度为0.95的置信区间为[4.106,33.028]。

八、(第1小题5分,第2和3小题各3分,第4和5小题各4分,共19分)某地区五月份的降雨量y与四月份的平均气温x(℃)有关,假设此关系是线性的。用Excel对气象站连续12年的统计资料进行回归分析,得到的部分结果如下:

1.假设总体回归模型为Y=β0+β1X+ε,请推导β0和β1的最小二乘估计量。

2.根据上述结果,计算五月份的降雨量y与四月份的平均气温x的相关系数。(保留2位小数)

3.写出估计的回归方程的表达式,并说明回归系数的含义。(保留4位小数)

4.分别在1%和5%的显著性水平下,使用F检验结果评价估计方程的显著性。

5.填出方差分析表中缺少的项目(a~h)。(保留2位小数)。

解:1.最小二乘法即估计参数使得:

令Q=∑(yi-y(∧)i2,在给定样本数据后,Q是β(∧)0,β(∧)1的函数,且最小值总是存在。根据微积分的极值定理,对Q求相应于β(∧)0,β(∧)1的偏导数,并令其等于0,便可求出β(∧)0,β(∧)1

解上述方程组得:

2.由表中数据可得:

由于在回归结果中平均气温x的回归系数符号为正,故降雨量y与平均气温x的相关系数r为正数。对于一元线性回归方程来说,因变量y与自变量x的相关系数

故降雨量y与平均气温x的相关系数:

3.由回归分析表结果可得回归方程为:Y(∧)=12.8435+1.0306x。其中回归系数1.0306表示四月份的平均气温每上升1℃,五月份的降雨量增加1.0306个单位。

4.F检验P值为0.0167,由于0.1<0.0167<0.5,故在5%的显著性水平下拒绝原假设,认为估计方程的整体线性关系显著;在1%的显著性水平下不能拒绝原假设,即在当前样本下不能认为估计方程的整体线性关系显著。

5.方差分析表如下:

附计算过程:

检验统计量:

其中,R2=0.4513,p=1,n-p-1=10。

计算得到F统计量=8.22,由R2=SSR/SST得:SSR=SST·R2=104.10。

则:

SSE=SST-SSR=126.57

MSR=SSR/P=104.10

MSE=SSE/(n-p-1)=12.66