Python广告数据挖掘与分析实战
上QQ阅读APP看书,第一时间看更新

3.2 数据预处理工具:Pandas

Pandas是一个基于NumPy的开源Python数据分析库,在数据准备、数据清洗、数据分析工作中会经常用到。Pandas提供了两个主要数据结构:序列(Series)和数据框(DataFrame)。其中,Series类似于NumPy中的一维数组,DataFrame类似于NumPy中的二维数组。我们可以通过Pandas方便地进行各类数据的读取,包括Excel、csv、txt文件,MySQL、Oracle等数据库文件,还可以通过Pandas进行数据的增删改查、合并、重塑、分组、统计分析等操作。如果你熟悉Excel,建议你认真学习本节内容,了解如何在Python中实现Excel的相应操作等。