贾俊平《统计学》(第6版)考研真题(含复试)与典型习题详解
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

三、简答题

1.简述直方图与茎叶图的区别。[对外经济贸易大学2016研]

答:直方图与茎叶图的区别主要表现为:

(1)直方图是用于展示分组数据分布的一种图形,它是用矩形的宽度和高度(即面积)来表示频数分布的。茎叶图是反映原始数据分布的图形,它由茎和叶两部分构成,其图形是由数字组成的。

(2)茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息;而直方图虽然能很好地显示数据的分布,但不能保留原始的数值。在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。

2.统计中用以描述品质型数据频数分布的图形主要有哪些?各自有何特点?[东北财经大学2012研]

答:品质型数据包括分类数据和顺序数据。描述分类数据频数分布的图形主要有条形图、帕累托图、饼图、环形图等;描述顺序数据频数分布的图形除了以上几种,还有累计频数分布图。

条形图是用宽度相同的条形的高度或长短来表示数据多少的图形。条形图可以横置或纵置,纵置时也称为柱形图。此外,条形图有简单条形图、对比条形图等形式。

帕累托图是按各类别数据出现的频数多少排序后绘制的柱形图。通过对柱形图的排序,容易看出哪类数据出现得多,哪类数据出现得少。帕累托图在质量控制研究中有广泛应用。对于不同类型的缺陷、失效方式和其他感兴趣的类,可以用帕累托图观察各个类的影响顺序。

饼图是用圆形及圆内扇形的角度来表示数值大小的图形。它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。

环形图相当于多个饼图的叠加,图中每个样本用一个环来表示,样本中的每一部分数据用环中的一段表示。因此环形图可显示多个样本各部分所占的相应比例,从而有利于对多个样本(或总体)构成的比较研究。

对于顺序数据,还可以计算累积频数和累积频率(百分比)。根据累积频数或累积频率,可以绘制累积频数分布或累积频率分布图。

3.欲调查广州市初中学生的身高情况,随机抽取100名广州市初中学生,测量了身高。

(1)用此例说明这几个统计概念,总体(population),样本(sample),参数(parameter),统计量(statistics)。

(2)请说明如何对这100例身高数据进行描述性统计分析。[中山大学2011研]

答:(1)总体(population)是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。本例中的总体是广州市所有初中学生。

样本(sample)是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。本例中的样本是随机抽取的100名广州市初中学生。

参数(parameter)是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。本例中广州市所有初中学生的平均身高即是一个参数。

统计量(statistic)是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。随机抽取的100名广州市初中学生的平均身高即是一个统计量。

(2)数据的描述性统计方法通常包括三种:统计图、统计表以及数值方法。因为此例中的数据为数值型数据,故可以用直方图、茎叶图、箱线图、频数分布表等对这100例身高数据进行描述性统计分析,还可以计算出该组数据的平均值、中位数和方差、全距等来分别反映其集中趋势和离散程度。

4.在盒子图(箱线图)的作图中,会使用哪些描述指标。[中央财经大学2011研]

答:箱线图(box plot)是由一组数据的最大值(maximum)、最小值(minimum)、中位数(median)、两个四分位数(quartiles)这五个特征值绘制而成的,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较。箱线图的绘制方法是:先找出一组数据的最大值、最小值、中位数和两个四分位数,然后,连接两个四分位数画出箱子;再将最大值和最小值与箱子相连接,中位数在箱子中间。

由上面叙述可知,箱线图使用的描述指标有:最大值、最小值、中位数、两个四分位数。

5.何谓统计分组?统计分组有哪些作用?[西安交大2005研、江苏大学2009研、上海财大2002研]

答:根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。

统计分组的作用有:(1)发现社会经济现象的特点与规律;(2)将复杂的社会经济现象划分为性质不同的各种类型;(3)反映总体内部结构;(4)揭示现象之间的依存关系。

6.简述统计分组的原则。[首经贸2009研、中南财大2002研]

答:科学的统计分组应遵循两个原则:

(1)必须符合“穷尽原则”,即总体中的每一个单位都有有组可归,或者说各分组的空间足以容纳总体的所有单位;

(2)必须遵守“互斥原则”,即总体中任一单位只能归属于一组,而不能同时可能归属于几个组。

例如:在对数值型数据进行组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组,不能在其他组中重复出现;不漏是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。

为解决不重的问题,统计分组时习惯上规定“上组限不在内”。即当相邻两组的上下限重叠时,恰好等于某一组上限的变量值不算在本组内,而计算在下一组内。而对于连续变量,可以采取相邻两组组限重叠的方法,根据“上组限不在内”的规定解决不重的问题;也可以对一个组的上限值采用小数点的形式,小数点的位数根据所要求的精度具体确定。

7.统计分组标志选择的原则。[北京林业大学2004研]

答:在进行统计分组标志选择时要遵循三个原则:

(1)应根据研究目的与任务选择分组标志。同一研究总体,研究的目的不同,可选用的分组标志也不同。

(2)要选用能反映事物本质或主要特征的标志。一般情况下,社会经济现象有多种特征,在选择分组标志时,可以使用这种标志,也可以选择另一种标志,这就需要根据被研究对象的特征,选择主要的、能抓住事物本质的标志进行分组。

(3)要根据现象所处的历史条件及经济条件来选择标志。由于社会是不断发展的,在不同的历史条件与经济条件下,选择的分组标志也不一样,要根据情况的变化而变化。

8.说明条形图和直方图的区别和联系。[中央财大2009研、人大2001研]

答:(1)条形图与直方图的区别

条形图是用条形的高度表示各类别频数的多少,其宽度是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。

由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。

条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。

(2)联系

二者都用来展示数据的分布情况;在平面直角坐标系中,二者的横轴都表示分组,纵轴都可表示频数或频率的大小。