2.1 Python基本安装和用法
Python是深度学习的首选开发语言,但是对于安装来说,第三方提供了集成了大量科学计算类库的Python标准安装包,目前最常用的是Anaconda。
Anaconda里面集成了很多关于Python科学计算的第三方库,主要是安装方便,而Python是一个脚本语言,如果不使用Anaconda,那么第三方库的安装会较为困难,各个库之间的依赖性就很难连接得很好。因此,这里推荐使用集合了大量第三方类库的安装程序Anaconda来替代Python的安装。
2.1.1 Anaconda的下载与安装
1. 第一步:下载和安装
Anaconda的下载地址是https://www.continuum.io/downloads/,页面如图2-1所示。
图2-1 Anaconda下载页面
目前下载的是Anaconda 4.3.1版本,里面集成了Python 3.6。读者可以根据自己的操作系统进行下载。
这里作者选择的是Windows版本,下载之后双击运行即可安装,过程基本与其他软件一样。安装完成以后,出现程序面板,目录如图2-2所示。
图2-2 Anaconda安装目录
2. 第二步:打开控制台
之后依次单击:开始→所有程序→Anaconda→Anaconda Prompt,打开窗口的效果如图2-3所示。这些步骤和打开CMD控制台类似,输入命令就可以控制和配置Python。在Anaconda中最常用的是conda命令,这个命令可以执行一些基本操作。
图2-3 Anaconda Prompt控制台
3. 第三步:验证Python
在控制台中输入python,会打印出版本号以及控制符号。然后在Python控制符号>>>后输入代码:
print("hello Python")
输入结果如图2-4所示。
图2-4 验证Anaconda Python安装成功
4. 第四步:使用conda命令
作者建议读者使用Anaconda的好处在于,它能够方便地帮助读者安装和使用大量第三方类库,查看已安装的第三方类库的命令是:
conda list
在Anaconda Prompt控制台中输入exit(),或者重新打开Anaconda Prompt控制台后直接输入conda list代码,结果如图2-5所示。
图2-5 列出已安装的第三方类库
Anaconda中使用conda进行操作的方法还有很多,其中最重要的是安装第三方类库,命令如下:
conda install name
这里的name是需要安装的第三方类库名,例如当需要安装NumPy包(这个包已经安装过),那么输入相应的命令就是:
conda install numpy
使用Anaconda的一个特别的好处就是可以自动安装包的依赖类库,如图2-6所示,这样大大减轻了使用者在安装和使用某个特定类库时碰到的依赖类库缺失的困难,使得后续工作顺利进行。
图2-6 自动获取或更新依赖类库
2.1.2 Python编译器PyCharm的安装
和其他语言类似,Python程序的编写可以使用Windows自带的控制台进行。但是这种方式对于较为复杂的程序工程来说,容易混淆相互之间的层级和交互文件,因此在编写程序工程时,作者建议使用专用的Python编译器PyCharm。
1. 第一步:PyCharm的下载和安装
PyCharm的下载地址为http://www.jetbrains.com/pycharm/。
进入Download页面后可以选择不同的版本,有收费的专业版和免费的社区版,如图2-7所示。这里作者建议读者选择免费的社区版即可。本书使用的版本为2017.1.2。
图2-7 PyCharm的免费版
安装文件下载下来后,双击运行进入安装界面,直接单击Next按钮采用默认安装即可,如图2-8所示。
图2-8 PyCharm的安装文件
需要注意的是,在安装PyCharm的过程中需要对安装的位数进行选择,这里建议读者选择与所安装Python相同位数的文件,如图2-9所示。
图2-9 PyCharm的位数选择
安装完成后出现Finish按钮,单击后完成安装,如图2-10所示。
图2-10 PyCharm安装完成
2. 第二步:使用PyCharm创建程序
单击桌面上新生成的图标进入PyCharm程序界面,首先是第一次启动的定位,如图2-11所示。
图2-11 PyCharm启动定位
这里是对程序存储的定位,一般建议选择第二项,由PyCharm自动指定,单击OK按钮。之后单击弹出的Accept按钮,接受相应的协议,进入界面配置选项,如图2-12所示。
图2-12 PyCharm界面配置
在配置区域可以选择自己的使用风格对PyCharm的界面进行配置,如果对其不熟悉的话,直接单击OK按钮使用默认配置即可。
最后就是创建一个新的工程,如图2-13所示。
图2-13 PyCharm工程创建界面
在这里,建议读者新建一个PyCharm的工程文件,如图2-14所示。
图2-14 PyCharm新建文件界面
之后右击新建的工程名“PyCharm”,在弹出的菜单中单击“new”|“Python File”新建一个“helloworld”文件,内容如图2-15所示。
图2-15 新建的helloworld文件
输入代码后,单击run|run…菜单开始运行,或者直接右击“helloworld.py”后,在弹出的菜单中选择run。如果成功输出“hello world”,那么恭喜你,Python与PyCharm的配置就成功了!
2.1.3 使用Python计算softmax函数
对于Python科学计算来说,最简单的想法就是可以将数学公式直接表达成程序语言,可以说,Python满足了这个想法。本小节将使用Python实现和计算一个深度学习中最为常见的函数——softmax函数。至于这个函数的作用,现在暂时不做说明,作者只是带领读者尝试实现其程序的编写。
首先softmax计算公式如下所示:
其中Vi是长度为j的数列V中的一个数,带入softmax的结果其实就是先对每一个Vi取e为底的指数计算变成非负,然后除以所有项之和进行归一化,之后每个Vi就可以解释成观察到的数据Vi属于某个类别的概率,或者称作似然(Likelihood)。
softmax用以解决概率计算中概率结果大占绝对优势的问题。例如函数计算结果中的2个值a和b,且a>b,如果简单地以值的大小为单位衡量的话,那么在后续的使用过程中,a永远被选用,而b由于数值较小而不会被选择,但是有时也需要数值小的b被使用,那么softmax就可以解决这个问题。
softmax按照概率选择a和b,由于a的概率值大于b,在计算时a经常会被取得,而b由于概率较小,取得的可能性也较小,但是也有概率被取得。
公式softmax的代码如下所示:
可以看到,当传入一个数列后,分别计算每个数值所对应的指数函数值,之后将其相加后计算每个数值在数值和中的几率。
结果如下所示: