Python大数据与机器学习实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第4章 数据可视化

在Python中,数据可视化有很多选择,本章介绍其中三个常用的工具。第一部分的Matplotlib是最常用的Python作图工具,用它可以创建大量的2D图表和简单的3D图表,此部分主要介绍图表本身。第二部分的Seaborn工具是对Matploblib的封装,它让我们仅用少量代码就能实现大多数的数据分析功能,此部分的学习主要集中在图表与数据分析功能的结合上。第三部分的PyEchars封装了百度开源图表库Echarts,使用它可以将图表生成互动网页,此部分偏重以数据为核心的具体应用。

图表是将工作表中的数据用图形表示出来。在数据分析时,具象的图表展示往往能提供更多的信息。在数据展示时,常用于制作PPT、报告、论文等,展示对象一般是同事、客户或者读者,受众多数不是数据分析的专业人士。因此,先要确定展示的目标和受众,作图表如同写应用文,最重要的是用直观的方法表述清楚,如果同时能做到工整和美观则更好。例如,用三维柱图展示工作表内容,如图4.1所示。同样的内容,如表4.1所示。

图4.1 三维柱图

表4.1 数据表

虽然三维柱图看起来比较“高级”,但是对于上述数据,其表达能力反而不如表简单清晰。这种图放在PPT中,反而会影响受众对内容的理解。