Python数据分析从小白到专家
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2.1 数据分析基础:NumPy、Pandas和Matplotlib库概述

NumPy作为Python科学计算和数据分析的一个基础包,有着举足轻重的作用。NumPy作为Python中的一个第三方库提供了多维数组对象Series,以及各种派生对象(如矩阵等)。NumPy是最常用的一个用于科学计算和数据分析的第三方库,它的数学基础是线性代数。NumPy提供了多种API和方法,如排序、转置矩阵、傅里叶变换等。而Pandas和Matplotlib这两个第三方库是由NumPy库衍生而来的。

说Pandas库是Python数据分析和科学计算的基础一点都不为过,因为Python数据分析的核心是Pandas库,无论是使用非监督式学习还是监督式学习来分析数据,都离不开Pandas库。若想要查看和汇总数据、了解各个数据的占比与关系,首先就得打印表格,而Pandas库新增的数据结构DataFrame可以完美地满足该需求。基于NumPy库的Pandas库不仅拥有DataFrame数据结构,由于其本身是从NumPy库继承而来的,因此也拥有NumPy库的Series数据结构,这样用户处理数据就更加灵活了。

Matplotlib是一个基于Python脚本的2D绘图库,即它只能绘制平面图形,一般情况下并不能绘制3D图形,除非导入Matplotlib库的3D拓展库。也就是说,一般使用Matplotlib库来绘制xOy直角坐标系图。当然,Matplotlib库也有拓展库Axes3D,用于绘制空间直角坐标系图。