Python爬虫开发:从入门到实战(微课版)
上QQ阅读APP看书,第一时间看更新

2.1 Python的安装和运行

由于历史原因,Python有两个主要的大版本:Python 2与Python 3。这两个大版本同时在往各自的方向发展。绝大多数的Python代码在这两个大版本中可以通用,但也有少数代码只能在Python 2中运行,或者只能在Python 3中运行。

Python官方曾经宣布,在今后的发展中,Python 3的升级会增加新功能,而Python 2的升级只会做错误修正,不会增加新的功能。Python之父吉多·范罗苏姆(Guido van Rossum)建议使用Python 3,并逐步淘汰Python 2。Python官方推特宣布,在2020年停止维护Python 2。本书所有代码基于Python 3开发。

截至2017年4月,Python 2正式版的最新版本为Python 2.7.13, Python 3正式版的最新版本为Python 3.6.1。在各位读者读到本书的时候,Python 3.6的更高版本可能已经发布。本书所有代码可以无缝迁移到Python 3.6的更高版本。

2.1.1 在Windows中安装Python

Python的官方网站界面如图2-1所示。

图2-1 Python官方网站界面

使用Windows操作系统的读者,可访问https://www.python.org/ftp/python/3.6.1/python-3.6.1-amd64.exe下载Python 3.6.1或者更高版本的安装程序。由于Python官方网站会受到某些干扰,所以在我国部分地区长期无法访问,在另一些地区间歇性无法访问。如果以上网址无法访问,各位读者可稍后再尝试。

下载的文件名为python-3.6.1-amd64.exe。下载完成以后,双击这个安装程序,安装界面如图2-2所示。

图2-2 Python安装界面

一定要勾选“Add Python 3.6 to PATH”复选框,这一点非常重要。然后选择“Install Now”选项,即可开始安装Python 3.6.1。安装完成以后,按“Win+R”组合键(“Win键”是键盘上像汉字“田”的那个键),在弹出的“运行”对话框中输入“cmd”(不包括最外层双引号,下同),如图2-3所示。

图2-3 在“运行”对话框输入“cmd”

单击“确定”按钮,打开Windows命令提示符(Command Prompt, CMD)窗口,如图2-4所示。

图2-4 Windows命令提示符窗口

输入“python”并按下键盘上的回车键,如果CMD窗口显示信息如图2-5所示,表明Python安装成功,并进入了Python交互环境。

图2-5 启动Python交互模式成功

在图2-5中,出现了3个向右的箭头“>>>”,这是提示用户输入内容。在本章以及后面章节中的代码中如果有这样的3个箭头,表示代码就是在图2-5所示的窗口中直接输入的。例如:

    >>> 1+1
    2

这两行代码表示把“1+1”通过键盘输入到这个Python交互环境中,然后按下回车键,下面不带3个箭头的数字“2”表示Python交互环境输出的内容。

2.1.2 在Mac OS中安装Python

Mac OS系统自带Python 2。对于Python 3,有两种不同的安装方法。

如果有编程基础,或者会使用Homebrew,可以通过Homebrew安装Python 3,其安装命令为:

    brew install python3

由于Homebrew在我国部分地区会受到一些干扰,要解决这个问题需要一些技术基础,所以对于没有编程基础或者没有Homebrew的读者,可以访问https://www.python.org/ftp/python/3.6.1/python-3.6.1-macosx10.6.pkg,下载Python 3的安装包。安装过程与安装普通软件没有区别,此处不再赘述。

2.1.3 在Linux中安装Python

Linux的发行版众多,这里仅以Ubuntu为例来说明如何在Linux中安装Python 3。其他发行版请查阅该发行版的官方说明。

Ubuntu 16.04或者更高版本的系统自带了Python 3.5.1或者更高版本的Python。这个版本的Python可以正常运行本书所有的代码,因此使用Ubuntu 16.04或者以上系统的读者可以跳过这一节。

如果使用较低版本的Ubuntu,系统自带Python 2。某些系统可能只带Python 3.4.x。这里的x是一个数字,随系统安装时间的不同而不同。读者可以在终端里输入以下代码查看系统自带的Python 3的版本:

    python3--version

如果返回类似于Python 3.4.3的结果,就表示系统确实自带Python 3.4.x。这种情况下,就需要单独安装Python 3.6。

如果Ubuntu版本为16.04,直接在终端中输入以下几条命令来安装Python 3.6.1即可:

    sudo add-apt-repository ppa:fkrull/deadsnakes
    sudo apt-get update
    sudo apt-get install python3.6 python3-dev python3-pip libxml2-dev libxslt1-dev zlib1g-dev libffi-dev libssl-dev

如果系统为16.10或者17.04,那么安装Python 3.6非常简单,不需要添加软件源,直接使用“apt-get”安装即可:

    sudo apt-get update
    sudo apt-get install python3.6 python3-dev python3-pip libxml2-dev libxslt1-dev zlib1g-dev libffi-dev libssl-dev

需要注意的是,由于Python 2在Ubuntu里面会被系统调用,因此不建议卸载或者修改系统自带的Python 2。在这种情况下,可以在Ubuntu的终端里输入“python3.6”来启动Python 3.6。