第3章 数据的图表展示
一、单项选择题
1.下面哪个图形保留了原始数据的信息?( )[对外经济贸易大学2015研]
A.直方图
B.茎叶图
C.条形图
D.箱线图
【答案】B
【解析】茎叶图是保留并反映原始数据分布的图形,它由茎和叶两部分构成,其图形是由数字组成的。ACD三项都需要对原始数据进行处理,求得一些测度值之后再作出图形。
2.下列哪种分类结果属于非顺序数据?( )[华中农业大学2015研]
A.产品质量按等级分类
B.人口按男女性别分类
C.考核结果按优秀、良好、合格、不合格分类
D.学历按小学、初中、高中、大专、本科、硕士及以上分类
【答案】B
【解析】顺序数据是只能归于某一有序类别的非数字型数据,顺序数据虽然也是类别,但这些类别是有序的。ACD三项均属于顺序数据。B项,人口按男女性别分类只能归于某一类别,但这些类别是无序的,故属于分类数据。
3.用于显示时间序列数值型数据,以反映事物发展变化的规律和趋势的图是( )。[重庆大学2013研]
A.直方图
B.箱线图
C.茎叶图
D.线图
【答案】D
【解析】如果数值型数据是在不同时间上取得的,即时间序列数据,则可以绘制线图。线图主要用于反映现象随时间变化的特征。
4.雷达图的主要用途是( )。[浙江工商大学2011研、安徽财经大学2012样题]
A.反映一个样本或总体的结构
B.比较多个总体的构成
C.反映一组数据的分布
D.比较多个样本的相似性
【答案】D
【解析】雷达图在显示或对比各变量的数值总和时十分有用。假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。此外,利用雷达图也可以研究多个样本之间的相似程度。
5.美国汽车制造商协会想了解消费者购车时的颜色偏好趋势,抽取新近售出的40辆车并记录其颜色种类(黑、白、红、绿、棕)和深浅类型(亮色、偏淡、中等、偏浓);你认为以下展示数据的图表中,哪一种不适合用来处理这一样本数据?( )[中山大学2011研]
A.散点图
B.饼图
C.条形图
D.频数图
【答案】A
【解析】散点图是用二维坐标展示两个变量之间关系的一种图形。它是用坐标横轴代表变量x,纵轴代表变量y,每组数据(xi,yi)在坐标系中用一个点表示,n组数据在坐标系中形成的n个点称为散点,由坐标及其散点形成的二维数据图称为散点图。它处理的是数值型数据。而BCD三项都可以用来处理分类数据和顺序数据。
6.根据某地6至16岁学生近视情况的调查资料,反映患者的年龄分布可用( )。[中山大学2011研]
A.线图
B.散点图
C.直方图
D.条形图
【答案】C
【解析】直方图是用来反映数据分布的直观形式,它的横坐标代表变量分组,纵坐标代表各变量值出现的频数。条形图是用来反映分类数据的,反映数值型数据一般用直方图;散点图反映两个变量间的关系;线图主要用来反映现象随时间变化的特征。
7.一名研究人员希望通过图形来说明4月份以来北京地区二手房租金每天的变化,如下哪个图形最合适?( )[中央财经大学2011研]
A.直方图
B.散点图
C.折线图
D.茎叶图
【答案】C
【解析】直方图是用于展示分组数据分布的一种图形,它是用矩形的宽度和高度(即面积)来表示频数分布的;散点图是用二维坐标表示两个变量之间关系的一种图形;如果数值型数据是在不同时间上取得的,即时间序列数据,则可以绘制折线图,折线图主要用于反映现象随时间变化的特征。
8.对于100名学生某一门课程的成绩,若想得到四分之一分位数、中位数与四分之三分位数,以下哪种描述统计的办法更有效?( )[中山大学2012研]
A.直方图
B.茎叶图
C.饼图
D.点图
【答案】B
【解析】直方图、饼图描述的数值型数据是分组数据,而茎叶图描述的是未分组的数值型数据,点图描述的是两个变量之间的关系。茎叶图保留了原始数据的信息,可以计算其分位数。
9.某外商投资企业按工资水平分为四组:1000元以下,1000~1500元;1500~2000元;2000元以上。第一组和第四组的组中值分别为( )。[首经贸2009研]
A.750和2500
B.800和2250
C.800和2500
D.750和2250
【答案】D
【解析】根据开口组组距与相邻组组距相同,即均是500,以及第一组的上限是1000,第四组的下限是2000,可得:
第一组的组中值=1000-500÷2=750
第四组的组中值=2000+500÷2=2250
10.统计分组的核心问题是( )。[西安交大2006研]
A.选择分组方法
B.确定组数
C.选择分组标志
D.确定组中值
【答案】C
【解析】分组标志作为现象总体被划分为各个不同性质的组的标准或根据,选择的正确与否,关系到能否正确地反映总体的性质特征、实现统计研究的目的。
11.组上限是指( )。[江苏大学2009研]
A.每个组的最小值
B.每个组的最大值
C.每个组的中点数值
D.每个组的起点数值
【答案】B
【解析】组限是指数列中每个分组两端表示各组界限的变量值。每组有两个组限:数值最小的为组的下限;数值最大的为组的上限。
12.饼图的主要用途是( )。
A.反映一个样本或总体的结构
B.比较多个总体的构成
C.反映一组数据的分布
D.比较多个样本的相似性
【答案】A
【解析】饼图是用圆形及圆内扇形的角度来表示数值大小的图形。它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。
13.下列各项中,适合于比较研究两个或多个样本或总体的结构性问题的是( )。
A.环形图
B.饼图
C.直方图
D.茎叶图
【答案】A
【解析】环形图可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环,样本中的每一部分数据用环中的一段表示。因此,环形图可显示多个样本或总体各部分所占的相应比例。
14.在连续变量或变量值较多的情况下,通常采用的分组方法是( )。
A.单变量值分组
B.组距分组
C.等距分组
D.连续分组
【答案】B
【解析】在连续变量或变量值较多的情况下,通常采用组距分组。它是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。在组距分组中,一个组的最小值称为下限;一个组的最大值称为上限。
15.在坐标系中,矩形的宽度表示直方图的( )。
A.频数
B.组中值
C.组距
D.组限
【答案】C
【解析】直方图是用于展示分组数据分布的一种图形,它是用矩形的宽度和高度(即面积)来表示频数分布的,宽度表示各组的组距。绘制该图时,在平面直角坐标系中,用横轴表示数据分组,纵轴表示频数或频率。这样,各组与相应的频数就形成了一个矩形,即直方图。
16.各组的组中值代表组变量值的( )。
A.一般水平
B.最高水平
C.最低水平
D.随机水平
【答案】A
【解析】组中值是指组距数列每组下限与上限之间中点位置上的数值,近似地代替每组变量值的一般水平。
17.某同学统计学考试成绩为80分,应将其计入( )。
A.成绩为80分以下的人数中
B.成绩为70~80分的人数中
C.成绩为80~90分的人数中
D.根据具体情况来具体确定
【答案】C
【解析】采用组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组,不能在其他组中重复出现。为解决不重的问题,统计分组时习惯上规定“上组限不在内”,即当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内。按照不重原则,该同学统计学考试成绩为80分应计入成绩为80~90分的人数中。
18.组距、组限和组中值之间的关系是( )。
A.组距=(上限-下限)÷2
B.组中值=(上限+下限)÷2
C.组中值=(上限-下限)÷2
D.组限=组中值÷2
【答案】B
【解析】组距是一个组的上限与下限的差,组距=上限-下限。它可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值-最小值)÷组数。而组中值是指组距数列每组下限与上限之间中点位置上的数值,故B项正确。
19.为描述身高与体重之间是否有某种关系,适合采用的图形是( )。
A.雷达图
B.气泡图
C.散点图
D.箱线图
【答案】C
【解析】散点图是用二维坐标表示两个变量之间关系的一种图形。题中只有两个变量,即身高和体重,因此可用散点图来描述。A项是显示多个变量之间关系的常用图示方法;B项是展示三个变量之间的关系的图示方法;D项是由一组数据的最大值、最小值、中位数、两个四分位数这五个特征值绘制而成的。
20.为了研究多个不同变量在不同样本间的相似性,适合采用的图形是( )。
A.环形图
B.茎叶图
C.雷达图
D.箱线图
【答案】C
【解析】雷达图是显示多个变量的常用图示方法,也称为蜘蛛图。雷达图也可以研究多个样本之间的相似程度。
21.5家公司的月销售额(万元)数据分别为:29,26,25,23,23。下列哪种图形不宜用于描述这些数据?( )
A.茎叶图
B.散点图
C.条形图
D.饼图
【答案】B
【解析】散点图是展示两个变量之间关系的一种图形,而本题中只有一个变量即月销售额数据。
22.与直方图相比,茎叶图( )。
A.没保留原始数据的信息
B.更适合描述分类数据
C.不能有效展示数据的分布
D.保留了原始数据的信息
【答案】D
【解析】茎叶图类似于横置的直方图。与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息。而直方图虽然能很好地显示数据的分布,但不能保留原始数值。茎叶图适合描述未分组数据。
23.下列图形中,适合描述顺序数据的是( )。
A.直方图
B.茎叶图
C.环形图
D.箱线图
【答案】C
【解析】顺序数据的图示方法有条形图、帕累托图、饼图、累积频数分布图和环形图等。ABD三项适合描述数值型数据。
24.将某企业职工的月收入依次分为2000元以下、2000元~3000元、3000元~4000元、4000元~5000元、5000元以上几个组。第一组的组中值近似为( )。
A.1000
B.1500
C.2000
D.2500
【答案】B
【解析】组中值是上限和下限之间的中点数值,它是代表各组标志值一般水平的数值。对于开口组的组距和组中值的确定,一般以其邻近组的组距为准。所以第一组的组中值=上限-邻组组距/2=2000-1000/2=1500。
25.某连续变量的分组中,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( )。
A.185
B.215
C.230
D.260
【答案】C
【解析】缺上限的最大组的组中值=最大组的下限+相邻组的组距/2。由题可知,末组相邻组的上限即为末组的下限值200,相邻组的组距/2=200-170=30。所以,末组的组中值=200+30=230。
26.统计表的行标题表示各组的名称,一般应写在统计表的( )。
A.上方
B.左方
C.右方
D.均可以
【答案】B
【解析】统计表一般由四个主要部分组成,即表头、行标题、列标题和数据资料。行标题和列标题通常安排在统计表的第一列和第一行,即统计表的左方和上方,分别表示的是所研究问题的类别名称和变量名称。