Python数据分析、挖掘与可视化(慕课版)
上QQ阅读APP看书,第一时间看更新

1.1.3 安装扩展库

库或包一般指包含若干模块的文件夹,模块指一个包含若干函数定义、类定义或常量的Python源程序文件。除了math(数学模块)、random(随机模块)、datetime(日期时间模块)、collections(包含更多扩展版本序列的模块)、functools(与函数以及函数式编程有关的模块)、urllib(与网页内容读取和网页地址解析有关的模块)、itertools(与序列迭代有关的模块)、string(字符串操作)、re(正则表达式模块)、os(系统编程模块)、os.path(与文件、文件夹有关的模块)、zlib(数据压缩模块)、hashlib(安全哈希与报文摘要模块)、socket(套接字编程模块)、tkinter(GUI编程模块)、sqlite3(操作SQLite数据库的模块)、csv(读写CSV文件的模块)、json(读写JSON文件的模块)、pickle(数据序列化与反序列化的模块)、statistics(统计模块)、time(与时间操作有关的模块)等大量内置模块和标准库(完整清单可以通过官方在线帮助文档进行查看),Python还有xlrd(用于读取Excel2003之前版本文件)、xlwt(用于写入Excel 2003之前版本文件)、openpyxl(用于读写Excel 2007及更高版本文件)、python-docx(用于读写Word2007及更新版本文件)、python-pptx(用于读写PowerPoint2007及更新版本文件)、pymssql(用于操作Microsoft SQL Server数据库)、pillow(用于数字图像处理)、pyopengl(用于计算机图形学编程)、numpy(用于数组计算与矩阵计算)、scipy(用于科学计算)、pandas(用于数据分析与处理)、matplotlib(用于数据可视化或科学计算可视化)、scrapy(爬虫框架)、sklearn(用于机器学习)、tensorflow(用于深度学习)、django(用于网站开发)等,几乎渗透到所有领域的扩展库或第三方库。

标准的Python安装包只包含了内置模块和标准库,没有包含任何扩展库,开发人员可以根据实际需要再安装和使用合适的扩展库。Python自带的pip工具是管理扩展库的主要方式,支持Python扩展库的安装、升级和卸载等操作。常用pip命令的使用方法如表1-1所示。

表1-1 常用pip命令的使用方法

在Windows平台上,如果在线安装扩展库失败,可以下载扩展库编译好的“.whl”文件(一定要选择正确版本且不要修改下载的文件名),然后在命令提示符环境中,使用pip命令进行离线安装。例如:

pip install pandas-0.24.0-cp37-cp37m-win_amd64.whl

注意,如果计算机上安装了多个版本的Python开发环境,在一个版本下安装的扩展库无法在另一个版本中使用。用户多版本安装时,最好切换至相应版本的Python安装目录的scripts文件夹中,然后按“Shift”键的同时单击鼠标右键,在弹出的菜单中选择“在此处打开命令提示符窗口”(Win 7)或“在此处打开Power Shell窗口”(Win 10),进入命令提示符环境执行pip命令(如果使用PowerShell,需要在pip命令前加上“./”)。如果要离线安装扩展库,最好也把“.whl”文件下载到相应版本的scripts文件夹中。

在Anaconda3开发环境中,除了pip之外,也可以使用conda命令安装Python扩展库,用法与pip类似。不过,并不是每个扩展库都有相应的conda版本,如果遇到conda无法安装的扩展库,进入Anaconda3安装目录的scripts文件夹中,使用pip安装之后,同样可以在Anaconda3的Jupyter Notebook和Spyder环境中使用。