2011年浙江工商大学432统计学[专业硕士]考研真题及详解
一、单项选择题(本题包括1~30题共30个小题,每小题2分,共60分。在每小题给出的四个选项中,只有一个符合题目要求,把所选项前的字母填在答题纸上)。
1为了调查某校学生的购书费用支出,从各年级的学生中分别抽取100名学生,组成样本进行调查,这种抽样方法属于( )。
A.简单随机抽样
B.分层抽样
C.系统抽样
D.整群抽样
【答案】B
【解析】简单随机抽样就是从包括N个单位的抽样框中随机地、一个个地抽取n个单位作为样本,每个单位的入样概率是相等的。分层抽样是将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计。系统随机抽样也称为机械随机抽样或等距离随机抽样。它是先将总体中各单位按一定的顺序排列,然后每隔一定的距离抽取一个单位构成样本。整群抽样又称聚类抽样,是将总体中若干个单位合并为组,这样的组称为群,抽样时直接抽取群,然后对选中群中的所有单位全部实施调查。
2已知某工厂生产的某零件的平均厚度是2厘米,标准差是0.25厘米。如果已知该厂生产的零件厚度为正态分布,可以判断厚度在1.5厘米到2.5厘米之间的零件大约占( )。
A.95%
B.89%
C.68%
D.99%
【答案】A
【解析】根据3σ原则,当一组数据对称分布时,经验法则表明:有68.27%的数据在平均数±1个标准差的范围之内;有95.45%的数据在平均数±2个标准差的范围之内;有99.73%的数据在平均数±3个标准差的范围之内。根据题干中的已知条件可以判断厚度在1.5厘米到2.5厘米之间的零件大约占95%。
3某校大二学生统计学考试的平均成绩是70分,标准差是10分,从该校大二学生中随机抽取100个同学作为样本,则样本均值的数学期望和抽样分布的标准误差分别为( )。
A.70,10
B.70,1
C.70,4
D.10,10
【答案】B
【解析】中心极限定理:设服从均值为μ方差为σ2(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值X的抽样分布近似服从均值为μ方差为σ2/n的正态分布。可知样本均值的数学期望为70,标准误差为
4根据一个具体的样本,计算总体均值的置信水平为90%的置信区间,则该区间( )。
A.以90%的概率包含总体均值
B.有10%的可能性包含总体均值
C.绝对包含总体均值
D.绝对包含总体均值或绝对不包含总体均值
【答案】D
【解析】由于用某个具体样本所构造的区间是一个特定的区间,而不再是随机区间,所以该区间绝对包含总体均值或绝对不包含总体均值。
5某企业计划投资2万元的广告费以提高某种新产品的销售量,企业经理认为做了广告可使每天销售量达100吨。实行此计划9天后经统计知,这9天的日平均销售量为99.32吨。假设每天的销售量服从正态分布N(μ,σ2),在α=0.05的显著性水平下,检验此项计划是否达到了该企业经理的预计效果,建立的原假设和备择假设为( )。
A.H0:μ=100,H1:μ≠100
B.H0:μ≤100,H1:μ>100
C.H0:μ≥100,H1:μ<100
D.H0:μ>100,H1:μ≤100
【答案】B
【解析】通常把观察现象原来固有的性质或没有充分证据不能轻易否定的命题设为原假设;通常把该观察现象新的性质或不能轻易肯定的结论设为备择假设。题中,实际统计的日销售量为99.32吨,即无法轻易肯定广告可使每天的销售量达到100吨,则原假设和备择假设应该为:H0:μ≤100,H1:μ>100。
6在回归分析中,因变量的预测区间估计是指( )。
A.对于自变量x的一个给定值x0,求出因变量y的平均值的区间
B.对于自变量x的一个给定值x0,求出因变量y的个别值的区间
C.对于因变量y的一个给定值y0,求出自变量x的平均值的区间
D.对于因变量y的一个给定值y0,求出自变量x的平均值的区间
【答案】B
【解析】预测区间估计是对x的一个给定值x0,求出y的一个个别值的估计区间,这一区间称为预测区间。
7在多元线性回归分析中,如果F检验表明线性关系显著,则意味着( )。
A.在多个自变量中至少有一个自变量与因变量之间的线性关系显著
B.所有的自变量与因变量之间的线性关系都显著
C.在多个自变量中至少有一个自变量与因变量之间的线性关系不显著
D.所有的自变量与因变量之间的线性关系都不显著
【答案】A
【解析】线性关系检验(F检验)表明回归方程显著时,这只是说,因变量至少同自变量中的一个自变量的线性关系是显著的,并非意味着同每个自变量之间的关系都显著。
8如果时间序列的逐期观察值按一定的增长率增长或衰减,则适合的预测模型是( )。
A.移动平均模型
B.指数平滑模型
C.线性模型
D.指数模型
【答案】D
【解析】移动平均模型和指数平滑模型是对平稳时间序列进行预测的方法,而线性模型和指数模型是对趋势型序列进行预测的方法。其中,线性模型用来对线性趋势序列进行预测,指数模型用来对非线性趋势序列进行预测。
9雷达图的主要用途是( )。
A.反映一个样本或总体的结构
B.比较多个总体的构成
C.反映一组数据的分布
D.比较多个样本的相似性
【答案】D
【解析】雷达图在显示或对比各变量的数值总和时十分有用。假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。此外,利用雷达图也可以研究多个样本之间的相似程度。
10某企业2010年1-4月初的商品库存额如下表:
则第一季度的平均库存额为( )。
A.(20+24+18+22)/4
B.(20+24+18)/3
C.(10+24+18+11)/3
D.(10+24+9)/3
【答案】C
【解析】该企业2010年第一季度的平均库存额为:(a1/2+a2+a3+a4/2)/3=(20/2+24+18+22/2)/3。
11某批产品的合格率为90%,从中抽出n=100的简单随机样本,以样本合格率估计总体合格率p,则的期望值和标准差分别为( )。
A.0.9,0.09
B.0.9,0.03
C.0.9,0.3
D.0.09,0.3
【答案】B
【解析】中心极限定理:设从均值为μ方差为σ2(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值X的抽样分布近似服从均值为μ方差为σ2/n的正态分布。则的期望值为90%,标准差为
12以样本统计量估计总体参数,要求估计量的数学期望等于被估计的总体参数,这一数学性质称为( )。
A.无偏性
B.有效性
C.一致性
D.期望性
【答案】A
【解析】无偏性是指估计量抽样分布的数学期望等于被估计的总体参数;有效性是指对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效;一致性是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
13在假设检验中,两个总体X~N(μ1,σ12),Y~N(μ2,σ22),其中μ1,μ2未知,检验σ12是否等于σ22应用( )。
A.μ检验法
B.t检验法
C.F检验法
D.χ2检验法
【答案】C
【解析】在两个正态总体条件下,两个方差之比服从F分布,所以检验两个总体方差是否相等,应用F检验法。
14在下面的假定中,哪一个不属于方差分析中的假定?( )
A.每个总体都服从正态分布
B.各总体的方差相等
C.观测值是独立的
D.各总体的方差等于0
【答案】D
【解析】方差分析中有三个基本假设:①每个总体都应服从正态分布;②各个总体的方差σ2必须相同;③观测值是独立的。
15在方差分析中,数据的误差是用平方和来表示的,其中组间平方和反映的是( )。
A.一个样本观测值之间误差的大小
B.全部观测值误差的大小
C.各个样本均值之间误差的大小
D.各个样本方差之间误差的大小
【答案】C
【解析】组间平方和,记为SSA,它是各组平均值i(i=1,2,…,k)与总平均值的误差平方和,反映各样本均值之间的差异程度。
16在多元线性回归分析中,t检验是用来检验( )。
A.总体线性关系的显著性
B.各回归系数的显著性
C.样本线性关系的显著性
D.H0:β1=β2=…=βk=0
【答案】B
【解析】回归系数的检验又称为t检验。线性关系的检验又称为F检验,是检验因变量y与k个自变量之间的关系是否显著。其原假设H0为β1=β2=…=βk=0
17超人电池制造商宣称他所制造的电池可使用超过330小时,为检验这一说法是否属实,研究人员从中抽取了12个电池进行测试,建立的原假设和备择假设为H0:μ≤330,H1:μ>330,检验结果是没有拒绝原假设,这表明( )。
A.有充分证据证明电池的使用寿命小于330小时
B.电池的使用寿命小于等于330小时
C.没有充分证据表明电池的使用寿命超过330小时
D.有充分证据证明电池的使用寿命超过330小时
【答案】C
【解析】检验结果没有拒绝原假设,说明没有充分证据表明接受备择假设,即没有充分证据表明电池的使用寿命超过330小时。
18为研究商品的展销方式和商店规模对其销售量是否有影响,在四类不同规模的商店采用三种不同展销方法进行销售,根据获得的销售量数据计算得到下面的方差分析表。表中“A”单元格和“B”单元格内的结果是( )。
A.0.277和0.375
B.1.357和0.737
C.3.615和2.665
D.0.737和0.375
【答案】C
【解析】在无交互作用的双因素方差分析中,A=FR=MSR/MSE=552.30/152.78≈3.615,B=FC=MSC/MSE=470.16/152.78≈2.665。
19对某时间序列建立的预测方程为t=100×(0.8)t,这表明该时间序列各期的观察值( )。
A.每期增加0.8
B.每期下降0.2
C.每期增长上期的80%
D.每期减少上期的20%
【答案】D
【解析】指数曲线的趋势方程t=b0b1t式中,b0,b1为待定系数。若b1>1,增长率随着时间t的增加而增加;若b1<1,增长率随着时间t的增加而降低;若b0>0,b1<1,t预测值逐渐降低,并以0为极限。
20进行多元线性回归时,如果回归模型中存在多重共线性,则( )。
A.整个回归模型的线性关系不显著
B.肯定有一个回归系数通不过显著性检验
C.肯定导致某个回归系数的符号与预期的相反
D.可能导致某些回归系数通不过显著性检验
【答案】D
【解析】在回归分析中存在多重共线性时将会产生某些问题:首先,变量之间高度相关时,可能会使回归的结果造成混乱,甚至会把分析引入歧途;其次,多重共线性可能对参数估计值的正负号产生影响,特别是正负号有可能同预期的正负号相反。某些重要的解释变量的回归系数t检验不显著而同时整个回归模型的线性关系检验显著,则通常预示着解释变量间存在多重共线性。
21某一时间数列,当取时间变量t=1,2,3,……时,有Y=38+72t,若取t=0,2,4,……,则趋势方程为( )。
A.y=38+144t
B.y=110+36t
C.y=72+110t
D.y=34+36t
【答案】B
【解析】设t′=2t-2,则t=(t′+2)/2,所以趋势方程为Y=38+72t=110+36t′,答案为B项。
22过去海山集团一直向A公司订购原材料,但是A公司发货比较慢。现B公司声称其发货速度要远快于A公司,于是海山集团倾向于向B公司订购原材料,为检验B公司的说法是否属实,随机抽取向B公司订的8次货进行检验。该检验的原假设所表达的是( )。
A.B公司交货日期比A公司短
B.B公司交货日期比A公司长
C.B公司交货日期不比A公司短
D.B公司交货日期不比A公司长
【答案】C
【解析】通常把观察现象原来固有的性质或没有充分证据不能轻易否定的命题设为原假设;通常把该观察现象新的性质或不能轻易肯定的结论设为备择假设。原假设与备择假设互斥,肯定原假设,意味着放弃备择假设;否定原假设,意味着接受备择假设。由此可知该检验的原假设为B公司交货日期不比A公司短。
23在回归分析中,残差平方和SSE反映了y的总变差中( )。
A.除了x对y的线性影响之外的其他因素对y变差的影响
B.由于x与y之间的线性关系引起的y的变化部分
C.由于x与y之间的非线性关系引起的y的变化部分
D.由于y的变化引起的x的误差
【答案】A
【解析】残差平方和又称误差平方和是指每一点的y值的估计值和实际值的差的平方之和,它是除了x对y的线性影响之外的其他因素引起的y的变化部分,是不能由回归直线来解释的yi变差部分,记为SSE。
24某银行从某类客户中,随机抽取36位客户,得到平均定期存款金额为30万元,标准差s=12万元,假设这类客户定期存款金额为正态分布。这类客户平均定期存款金额的95%置信区间为( )。
A.30±1.96
B.30±3.92
C.30±4
D.30±5.16
【答案】B
【解析】通常样本单位数大于30的样本可视为大样本,本题中n=36因此可看成是在大样本情况下,总体均值μ所在1-α置信水平下的置信区间为:
25某公司共有职工2000名,每月平均工资是2500元,标准差是500元。假定该公司职工的工资服从正态分布,月工资在2000元至3000元之间的职工人数大约为( )。
A.1750人
B.1950人
C.1550人
D.1360人
【答案】D
【解析】当一组数据对称分布时,经验法则表明:约有68%的数据在平均数±1个标准差的范围之内;约有95%的数据在平均数±2个标准差的范围之内;约有99%的数据在平均数±3个标准差的范围之内。根据题干中的已知条件可知约有68%的职工月工资在2000元至3000元之间,即2000×68%=1360(人)。
26设某人打靶每次击中靶心的概率为1/3,四次独立重复射击中,至少有一次击中的概率是( )。
A.8/81
B.16/81
C.36/81
D.65/81
【答案】D
【解析】设A=“至少有一次击中”,A的对立事件=“四次都没有击中”。P(A)=1-P()=1-(1-1/3)4=65/81。
27设离散型随机变量ξ的分布律为
则常数A应为( )。
A.e1/3
B.e-1/3
C.e-3
D.e3
【答案】B
【解析】由随机变量分布的性质可知
即
由于
所以A=e-1/3。
28设A,B,C表示3个事件,则AB+AC+BC表示( )。
A.A,B,C中有一个或两个发生
B.A,B,C中不多于一个发生
C.A,B,C中至少有两个发生
D.A,B,C中恰有两个发生
【答案】C
【解析】A,B,C中有一个或两个发生的表达式为A+B+C-ABC,A,B,C中不多于一个发生的表达式为+A+B+C;A,B,C中恰有两个发生的表达式为AB+BC+AC;事件A,B,C中至少有两个发生的表达式为:AB+BC+AC;事件A,B,C中至少有一个不发生的表达式为++。
29设随机变量ξ1~N(1,2),随机变量ξ2~N(0,3),ξ1,ξ2相互独立,则D(3ξ1-2ξ2)=( )。
A.30
B.12
C.6
D.0
【答案】A
【解析】当ξ1,ξ2相互独立时,3ξ1-2ξ2也相互独立,故D(3ξ1-2ξ2)=D(3ξ1)+D(-2ξ2)=9Dξ1+4Dξ2=9×2+4×3=30。
30设随机变量ξ的概率密度为
则η=( )~N(0,1)。
A.(ξ+3)/2
B.
C.(ξ-3)/2
D.
【答案】D
【解析】设X~N(μ,σ2),则Z=(X-μ)/σ~N(0,1)
由ξ的概率密度为
可知ξ的数学期望为3,方差为2,则
二、简要回答下列问题(本题包括1~4题共4个小题,每小题10分,共40分)。
1简述假设检验中显著性水平α的含义。
答:显著性水平α,意味着:在原假设成立时,如果事件的发生概率小于α,即小概率事件发生了,则认为原假设不成立。换言之,我们有1-α的把握拒绝原假设。α取不同的水平,将直接影响到拒绝域的临界值,并进而影响到判断结果。
(1)在假设检验中,拒绝原假设称样本结果在“统计上是显著的”;不拒绝原假设则称结果是“统计上不显著的”。
(2)“显著的”在这里的意义是指“非偶然的”,它表示这样的样本结果不是偶然得到的。
(3)在显著和不显著之间没有清楚的界限,只是P值越来越小时,我们有越来越强的证据而已。
2简述标志变异指标的意义和作用。
答:(1)标志变异指标的意义
标志变异指标又称为标志变动度,是反映总体各单位标志值之间差异程度大小的综合指标。标志变异指标说明的是变量的集中趋势。
(2)标志变异指标的作用
①衡量平均指标代表性的尺度;②研究现象的稳定性和均衡性;③为科学确定抽样单位数提供依据。测量标志变异的主要指标有极差、平均差、方差、标准差和标志变动系数等。
3动态数列采用的分析指标主要有哪些,为什么要注意速度指标和水平指标的结合运用?
答:动态数列又称时间数列,它是指某社会经济现象在不同时间上的一系列统计指标按时间先后顺序加以排列后形成的数列。动态数列采用的分析指标主要有现象发展的水平指标和现象发展的速度指标。
对动态序列的分析,要注意速度指标和水平指标的结合运用的原因如下:现象发展水平分析是现象发展速度分析的基础,速度分析是水平分析的深入和继续;速度指标是水平指标派生计算的,把它们结合起来运用,就能够对现象发展变化规律做出更加深刻的分析。
4简述指数分布无记忆性的特点。
答:设X服从参数为λ的指数分布,则对任何s,t≥0,有
P(X>s+t|X>s)=P(X>t)
指数分布的这种性质称为无记忆性。指数分布有无记忆性,直观地讲就是,从原分布的任意一时刻开始的分布与原分布相同。故又把指数分布称为“永远年轻”的分布。
三、计算与分析题(本题包括1~3题共3个小题,第1小题和第2小题每题20分,第3小题10分,共50分)。
1某企业生产的袋装食品采用自动打包机包装,每袋标准重量为500克。现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(克)如下:
(1)确定该种食品平均重量95%的置信区间。
(2)采用假设检验方法检验该批食品的重量是否符合标准要求?(α=0.05,写出检验的具体步骤)。
解:该种食品重量的平均值和标准差计算过程如下表:
由上面可得=24910/50=498.2
(1)已知=498.2,s=8.73,n=50,1-α=95%,zα/2=1.96。由于总体方差未知,但为大样本,可用样本方差来代替总体方差。
该种食品平均重量95%的置信区间为:
即该种食品平均重量95%的置信区间等于(495.78,500.62)。
(2)假设:H0:μ=500,H1:μ≠500
由题意可知,μ0=500,=498.2,s=8.73,n=50,因为是大样本,所以选用z统计量。
当α=0.05时,zα/2=1.96。因为|z|<zα/2,根据决策准则,没有理由拒绝H0,可以认为该批食品的重量符合标准要求。
2一家产品销售公司在25个地区设有销售分公司。为研究产品销售量(y)与该公司的销售价格(x1)、各地区的年人均收入(x2)、广告费用(x3)之间的关系,搜集到25个地区的有关数据。利用Excel得到下面的回归结果(α=0.05):
方差分析表
参数估计表
(1)将方差分析表中的所缺数值补齐。
(2)写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归系数的意义。
(3)检验回归方程的线性关系是否显著?
(4)计算判定系数R2,并解释它的实际意义。
(5)计算估计标准误差Se,并解释它的实际意义。
解:(1)方差分析表
(2)根据参数估计表,得到销售量与销售价格、年人均收入和广告费用的多元线性回归方程为:
=758.12-87.84x1+80.61x2+0.51x3
各回归系数的实际意义为:
1=-87.84表示,在年人均收入和广告费用不变的条件下,销售价格每增加1个单位,销售量平均减少87.84个单位;
2=80.61表示,在销售价格和广告费用不变的条件下,年人均收入每增加1个单位,销售量平均增加80.61个单位;
3=0.51表示,在销售价格和年人均收入不变的条件下,广告费用每增加1个单位,销售量平均增加0.51个单位。
(3)提出假设:
H0:β1=β2=β3=0,H1:β1,β2,β3至少有一个不等于0
计算检验统计量F:由方差分析表可知F=48.33。
查F分布表得Fα=0.05(3,21)=3.07,由于
F=48.33>Fα=0.05(3,21)=3.07
所以拒绝原假设H0。这意味着销售量与销售价格、年人均收入和广告费用之间有显著的线性关系。
(4)R2=SSR/SST=98369.1/112617.6=0.87
多重判定系数是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合度的一个统计量,反映了在因变量y的变差中被估计的回归方程所解释的比例。
(5)
se估计的是预测误差的标准差,其含义是根据自变量来预测因变量时的平均预测误差。本题中的含义为:根据所建立的多元回归方程,用销售价格、年人均收入和广告费用来预测销售量时,平均的预测误差为26.05个单位。
3假设某厂家生产的仪器,以概率0.7可以直接出厂,以概率0.3需进一步调试。经调试以后以概率0.8可以出厂,以概率0.2为不合格品不能出厂。现该厂新生产了10台仪器,分别求:
(1)全部能出厂的概率P1;
(2)其中恰有两台不能出厂的概率P2。
解:根据全概率公式计算可得,一台机器能出厂的概率p=0.7+0.3×0.8=0.94
一台机器不能出厂的概率q=0.3×0.2=0.06
(1)P1=p10=0.9410=0.54
即全部能出厂的概率为0.54。
(2)由于10台仪器相互独立,所以出厂数量服从二项分布B(10,0.94),所以恰有两台不能出厂的概率为恰有八台能出厂的概率:
P2=C108p8q2=C108×0.948×0.062=0.09875