上QQ阅读APP看书,第一时间看更新
1.2.1 量性数据
量性数据是按数字尺度测量的观察值,其结果表现为具体的数值,如人数、钱数、地理面积等都是量性数据。离散型数据是指数值只能用自然数或整数为单位的数据,如家庭人数为1人或2人,不会有1.5人。而连续型数据是指用小数为单位可无限拆分的数据,如体重可以被细化至小数点后N位数。那么在可视化呈现上二者的区别在哪里呢?我们来看以下两个例子。
图1.2.4中x轴为年级序列、y轴为学生的平均身高。随着年级数的增长,学生的身高呈现持续增长的趋势。使用折线图能很好地表达这种持续增长的关系。
图1.2.4
图1.2.5为某家庭成员人数变化的趋势,同样是表示数据持续增长,但因为y轴为家庭人数,为离散性数据,用折线图表示每年的变化会导致一个问题,即年与年之间的变化表达并不精确,例如在2012—2013年间,家庭人数不可能为2.5人。
图1.2.5
为了更为准确地表达家庭人数的变化趋势,我们采用柱状图(见图1.2.6),每一年的数值都是相对独立的,这样的表达效果更为清晰。
图1.2.6
值得注意的是,数值型数据和分类型数据可以互相转换,例如身高,年龄这类数据既可以是数值型数据也可以被转化为分类型数据。
图1.2.7为客户年龄的分布统计,该图的x轴为客户的年龄值(数值型数据),y轴为客户的计数。如果希望进一步分析人数最多的客户群,就需要将该数值型数据转换为分类型数据。
图1.2.7