第4章 数据的概括性度量
一、单项选择题
1.某企业男性职工占80%,月平均工资为450元,女性职工占20%,月平均工资为400元,该企业全部职工的平均工资为( )。[中央财经大学2015研]
A.425元
B.430元
C.435元
D.440元
【答案】D
【解析】企业全部职工的平均工资=男性职工比例×男性月平均工资+女性职工比例×女性月平均工资=80%×450+20%×400=440(元)。
2.15位同学的某门课程考试成绩中,70分出现3次,80分出现4次,85分出现6次,90分出现2次,则他们成绩的众数为( )。[华中农业大学2015研]
A.80
B.85
C.81.3
D.90
【答案】B
【解析】众数是一组数据中出现次数最多的变量值。题中,85分出现次数最多,故成绩的众数为85分。
3.一组样本的变异系数(CV)等于10,样本均值为5,则样本方差为( )。[厦门大学2014研]
A.2
B.4
C.0.5
D.2500
【答案】D
【解析】变异系数是一组数据的标准差与其相应的平均数之比,因而样本标准差=样本均值×变异系数=5×10=50,样本方差=50×50=2500。
4.现抽取了10个同学,每个同学的月生活费数据排序后为:660,750,780,850,960,1080,1250,1500,1630,2000。则中位数的位置为( )。[重庆大学2013研]
A.5.5
B.5
C.4
D.6
【答案】A
【解析】中位数是将样本排序后处于中间位置的数据,总共有10个样本,因此
5.哪种频数分布状态下平均数、众数和中位数是相等的?( )[东北财经大学2011研]
A.对称的钟形分布
B.左偏的钟形分布
C.右偏的钟形分布
D.U形分布
【答案】A
【解析】在频数对称且单峰分布的状态下,平均数、众数、中位数相等。
6.统计学期中考试非常简单,为了评估简单程度,教师记录了9名学生交上考试试卷的时间如下(分钟)[东北财经大学2012研]
33,29,45,60,42,19,52,38,36
(1)这些数据的极差为( )。
A.3.00
B.-3.00
C.41.00
D.-41.00
【答案】C
【解析】数据按从小到大排序结果如下:
19,29,33,36,38,42,45,52,60
故,极差=最大值-最小值=60-19=41。
(2)这些数据的除以样本自由度的方差为( )。
A.150.00
B.-150.00
C.-260.00
D.260.00
【答案】A
【解析】设样本方差为s2,除以样本自由度的方差的公式为:
代入数据计算得到样本均值﹦39.33,样本方差﹦150.00。
(3)这些数据的除以样本自由度的标准差为( )。
A.29.60
B.12.25
C.-12.25
D.-29.60
【答案】B
【解析】方差开方后即得到标准差。
(4)这些数据的离散系数为( )。
A.3.81
B.-0.31
C.-3.81
D.0.31
【答案】D
【解析】离散系数也称为变异系数,它是一组数据的标准差与其相应的平均数之比。故该组数据的离散系数为
7.现有一份样本,为100名中学生的IQ分数,由此计算得到以下统计量:样本平均(mean)=95,中位数(median)=100,下四分位数(lower quartile)=70,上四分位数(upper quartile)=120,众数(mode)=75,标准差(standard deviation)=30。则关于这100名中学生,下面哪一项陈述正确?( )[中山大学2011研]
A.有一半学生分数小于95
B.有25%的学生分数小于70
C.中间一半学生分数介于100到120之间
D.出现频次最高的分数是95
【答案】B
【解析】一半学生分数小于中位数,即100;中间一半学生分数介于下四分位数到上四分位数之间,即介于70到120之间;出现频次最高的分数是众数,即75。下四分位数是指该样本中所有数值由小到大排列后在0.25分位点上的数字,从题干中可知有25%的学生分数小于70。
8.投资某项目的收益率R是随机变量,其分布如表4-1所示;某位投资者在该项目上投资1000元,他的预期收入和预期收入的方差分别为( )元和( )(元)2。[中山大学2011研]
A.50,10
B.1050,10
C.1050,80
D.50,80
【答案】C
【解析】预期收益=1000×(4%×0.3+5%×0.5+6%×0.1+7%×0.1)=50(元);预期收入=1000+50=1050(元);预期收入的方差=(1000×4%-50)2×0.3+(1000×5%-50)2×0.5+(1000×6%-50)2×0.1+(1000×7%-50)2×0.1=80(元2)
9.随机变量X的方差为2,随机变量Y=2X,那么Y的方差是( )。[中央财经大学2011研]
A.1
B.2
C.4
D.8
【答案】D
【解析】由于Var(cX)=c2Var(X),故Var(Y)=Var(2X)=22×Var(X)=22×2=8。
10.已知数列{1,3,3,5,5,7,7,9,122},下面说法错误的是( )。[中央财经大学2011研]
A.算数平均数是18
B.中位数是5
C.众数是5
D.极差是121
【答案】C
【解析】众数是一组数据中出现次数最多的数值,有时一组数中的众数不止一个。由题干可知,众数是3,5,7。
11.设X1,X2,…,Xn为随机样本,则哪个统计量能较好地反映样本值的分散程度?( )[中山大学2012研]
A.样本均值
B.样本中位数
C.样本方差
D.样本的四分之一分位数
【答案】C
【解析】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。反映数据集中趋势的统计量有平均数、中位数、众数和四分位数;离散程度反映的是各变量值远离其中心值的程度,反映数据离散程度的统计量有异众比率、方差、标准差和四分位差等。
12.对一组数据的描述统计分析表明,样本均值=12.45美元,中位数=9.21美元,方差=22.85。由此可以计算样本数据的离散系数为( )。[中央财经大学2012研]
A.0.38
B.0.40
C.0.54
D.2.48
【答案】A
【解析】离散系数也称为变异系数,它是一组数据的标准差与其相应的平均数之比。其计算公式为:
得到
13.已知某工厂生产的某零件的平均厚度是2厘米,标准差是0.25厘米。如果已知该厂生产的零件厚度为正态分布,可以判断厚度在1.5厘米到2.5厘米之间的零件大约占( )。[浙江工商大学2011研]
A.95%
B.89%
C.68%
D.99%
【答案】A
【解析】当一组数据对称分布时,经验法则表明:约有68%的数据在平均数±1个标准差的范围之内;约有95%的数据在平均数±2个标准差的范围之内;约有99%的数据在平均数±3个标准差的范围之内。
14.某公司共有职工2000名,每月平均工资是2500元,标准差是500元。假定该公司职工的工资服从正态分布,月工资在2000元至3000元之间的职工人数大约为( )。[浙江工商大学2011研]
A.1750人
B.1950人
C.1550人
D.1360人
【答案】D
【解析】当一组数据对称分布时,经验法则表明:约有68%的数据在平均数±1个标准差的范围之内;约有95%的数据在平均数±2个标准差的范围之内;约有99%的数据在平均数±3个标准差的范围之内。根据已知条件可知约有68%的职工工资在2000元至3000元之间,即2000×68%=1360(人)。
15.比较两个不同平均数的同类现象或两个性质不同的不同类现象平均数的代表性大小时,采用( )。[首经贸2007研]
A.全距
B.平均差
C.标准差
D.标准差系数
【答案】D
【解析】标准差系数又称为离散系数(变异系数),它是一组数据的标准差与其相应的平均数之比。其计算公式为:
离散系数是测度数据离散程度的相对统计量,其作用主要是用于比较不同样本数据的离散程度。离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。
16.有下列甲、乙两组工人工资数据:甲组工人工资400,450,250,300;乙组工人工资300,475,350,275。若要比较这两组工人平均工资差异程度大小,应选用的方法是( )。[首经贸2006研]
A.全距法
B.标准差法
C.离散系数法
D.平均数法
【答案】B
【解析】由甲、乙两组工人工资数据可得:
由于甲、乙两组工人的平均工资相同,所以可以通过标准差的方法比较这两组工人平均工资差异程度大小,标准差较大的平均工资差异程度较大。
17.平均差数值越小,则( )。[江苏大学2009研]
A.反映变量值越分散,平均数代表性越小
B.反映变量值越集中,平均数代表性越大
C.反映变量值越分散,平均数代表性越大
D.反映变量值越集中,平均数代表性越小
【答案】B
【解析】平均差也称平均绝对离差,它是各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确地反映一组数据的离散状况。平均差越大,说明数据的离散程度越大;反之,则说明数据的离散程度越小。
18.一家公司在招收职员时,首先要通过两项能力测试。在S项测试中,其平均分数是125分,标准差是25分;在M项测试中,其平均分数是400分,标准差是50分。一位应试者在S项测试中得了150分,在M项测试中得了425分。与平均分数相比,这位应试者的哪一项测试更为理想?( )[中南财大2004研]
A.S项测试
B.M项测试
C.没有区别
D.无法判断
【答案】A
【解析】由标准分数的计算公式
可得两次成绩的标准分数分别为:
由于zS>zM,故S项成绩更为理想。
19.加权平均数的大小取决于( )。
A.频数绝对量的大小和变量值的大小
B.频数之间的比率
C.频数绝对量的大小和频数之间的比率
D.频数之间的比率和变量值的大小
【答案】D
【解析】加权平均数适用于原始资料已经分组,并得出次数分布的场合。计算公式为:
根据公式可知,加权平均数的大小取决于频数之间的比率和变量值x的大小。
20.若甲、乙、丙三人的数学成绩平均为72分,加上丁的数学成绩,平均为78分,则丁的数学成绩为( )分。
A.96
B.90
C.80
D.75
【答案】A
【解析】设丁的数学成绩为x分,由(72×3+x)/4=78可得:x=96。
21.某班共有60名学生,在期末的统计学考试中,男生的平均考试成绩为75分,标准差为6分;女生的平均考试成绩为80分,标准差为6分。如果该班的男女学生各占一半,则全班的平均考试成绩为( )。
A.75
B.76
C.77.5
D.80
【答案】C
【解析】设男生成绩为x,女生成绩为y,男女各30人,故全班的平均考试成绩为:
22.某幼儿园有58名小朋友,其年龄(单位:周岁)的直方图如图4-1所示,则小朋友年龄的众数为( )。
图4-1
A.4
B.5
C.25
D.58
【答案】A
【解析】由直方图4-1可以直观地看到4周岁的小朋友有25人,人数最多,因此众数为4。
23.由8位销售员一个月销售某产品的数量制作的茎叶图如图4-2所示,则销售量的中位数为( )。
A.5
B.6.5
C.45
D.56.5
图4-2 茎叶图
【答案】D
【解析】由茎叶图可知8个数值分别为:45,45,58,57,56,52,60,63,由小到大的排序为45,45,52,56,57,58,60,63,所以中位数为:
24.如果一组数据不是对称分布,根据切比雪夫不等式,对于k=4,其意义是( )。
A.至少有75%的数据落在平均数加减4个标准差的范围之内
B.至少有89%的数据落在平均数加减4个标准差的范围之内
C.至少有94%的数据落在平均数加减4个标准差的范围之内
D.至少有99%的数据落在平均数加减4个标准差的范围之内
【答案】C
【解析】根据切比雪夫不等式,至少有的数据落在k个标准差之内。其中k是大于1的任意值。对于k=2、3、4,该不等式的含义是:至少有75%的数据落入平均数±2个标准差的范围内;至少有89%的数据落入平均数±3个标准差的范围之内;至少有94%的数据落入平均数±4个标准差的范围之内。
25.假定一个样本由5个数据组成:3,7,8,9,13。该样本的方差为( )。
A.8
B.9.7
C.10.4
D.13
【答案】D
【解析】5个数据的均值为:
根据未分组数据的样本方差公式:
26.一组数据的离散系数为0.6,平均数为10,则方差为( )。
A.0.4
B.4
C.6
D.36
【答案】D
【解析】离散系数是一组数据的标准差与其相应的平均数之比,其计算公式为:
则标准差
所以方差。
27.某班学生的统计学平均成绩是70分,最高分是95分,最低分是65分,根据这些信息,可以计算的测度离散程度的统计量是( )。
A.方差
B.极差
C.标准差
D.中位数
【答案】B
【解析】测度数值型数据离散程度的方法主要有极差、平均差、方差和标准差。其中极差是一组数据的最大值与最小值之差。由于题中只给了最低分和最高分,所以只能计算极差。
28.在某公司进行的英语水平测试中,新员工的平均得分是80分,标准差是5分,中位数是85分,则新员工得分的分布形状是( )。
A.对称的
B.左偏的
C.右偏的
D.无法确定
【答案】B
【解析】如果数据的分布是对称的,众数、中位数和平均数必定相等;如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方靠,而中位数由于是位置代表值,不受极值的影响,因此两者之间的关系表现为:平均数<中位数;如果数据是右偏分布,说明数据存在极大值,必然拉动平均数向极大值一方靠,此时中位数<平均数。
29.对在某个高速路段行驶过的120辆汽车的车速进行测量后发现,平均车速是85公里/小时,标准差是4公里/小时,下列哪个车速可以看作是异常值?( )。
A.78公里/小时
B.82公里/小时
C.91公里/小时
D.98公里/小时
【答案】D
【解析】根据经验法则可知,约有99%的数据在平均数±3个标准差的范围之内,在3个标准差以外的数据是离群点。因此99%的数据应包含在(85±3×4)区间内,即(73,97),D项可以看作是异常值。
30.在离散程度的测度中,最容易受极端值影响的是( )。
A.极差
B.平均差
C.标准差
D.标准差系数
【答案】A
【解析】众数和中位数不受极端值的影响,而ABCD四项都会受到极端值的影响,但是由于极差是一组数据最大值与最小值之差,故最容易受极端值影响。
31.设一组数据的茎叶图如图4-3所示,此数据组的极差为( )。
A.1
B.6
C.7
D.21
图4-3
【答案】D
【解析】据茎叶图,可知原数据组为3,13,17,19,21,24,故其极差R=24-3=21。
32.两组数据的平均数不等,但标准差相等,则( )。
A.平均数小的,离散程度大
B.平均数大的,离散程度大
C.平均数小的,离散程度小
D.两组数据的离散程度相同
【答案】A
【解析】变异系数是指一组数据的标准差与其相应的平均数之比,是用来测度数据离散程度的相对统计量。其计算公式为:
可见,在标准差相等的情况下,平均数小的,其变异系数大,即离散程度较大。
33.如果峰态系数K>0,表明该组数据是( )。
A.尖峰分布
B.扁平分布
C.左偏分布
D.右偏分布
【答案】A
【解析】峰态系数用K表示。峰态通常是与标准正态分布相比较而言的。如果一组数据服从标准正态分布,则峰态系数的值等于0;若峰态系数小于0,则表明数据服从平峰分布;若峰态系数大于0,则表明数据服从尖峰分布。