上QQ阅读APP看书,第一时间看更新
2.1.1
集中趋势
平均数、中位数、众数3个统计量用于反映数据的集中趋势,这3个统计量的计算方法和使用场景如表2-1所示。
表2-1 反映数据集中趋势的统计量
下面举例说明反映数据集中趋势的统计量的应用方法,让读者对各统计量的计算方法与使用场景有更深入的理解。本例模拟将苹果按重量划分类别,划分标准为150~200克为小,200~250克为中,250~300克为大。
1.平均数
假设有5个苹果,它们的重量如表2-2所示。5个苹果重量的平均数为(220+235+210+215+240)÷5=224(克),类别划分为“中”,这组数据相对集中且没有异常值,因此通过平均数可以很好地反映数据的整体水平。
表2-2 平均数计算数据
2.中位数
假设有5个苹果,它们的重量如表2-3所示。5个苹果重量的平均数为(220+235+210+215+500)÷5=276(克),类别划分为“大”,很明显该划分结果与数据集中的多数数据不匹配。导致划分结果与多数数据不匹配的主要原因是有一个500克的苹果,属于异常数据。此时可以使用中位数进行判断,该组数据的中位数为220克,可以反映数据的整体水平。
表2-3 中位数计算数据
3.众数
假设有10个苹果,分别属于两个品种,它们的重量如表2-4所示。10个苹果重量的平均数为197克,中位数为200克。可以发现这两个统计量的差距不大,但都无法反映数据的整体水平。此时可以通过数据的众数160克、230克,反映两个品种苹果重量的整体水平。
表2-4 众数计算数据