数据科学技术与应用
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第3章 数据汇总与统计

数据汇总与统计是数据探索的重要方法,通过数据收集、汇聚、清洗和统计分析等过程,探索数据的概括性特征,形成有价值的推断,为后续的建模分析提供可靠的指导。探索性分析需要将相关数据同时存储以便处理,多维数组已无法满足需求。pandas基于NumPy提供了更复杂的数据结构,以及丰富、完善的数据准备和统计分析功能。本章将简要介绍分析过程中涉及的统计学概念,如何使用pandas完成各种数据探索功能,其中数据可视化将在第4章中介绍。